‘오픈AI Vs. 오픈AI’ 메타의 ‘라마’ 유출이 던진 질문

[AI요약] 메타의 대규모 언어모델 라마의 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. 기술기업으로부터 강력하게 통제되는 기술이냐, 누구나 접근가능한 기술이냐, 우리는 AI 미래를 위한 교차로에 서 있다.

메타 라마의 이번 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. (이미지=메타)

최근 메타(Meta)가 공개한 GPT 스타일의 인공지능(AI) 언어모델 ‘라마’(LLaMA)의 대규모 유출 현황과 전망에 대해 더가디언, 더버지 등 외신이 보도했다.

메타의 목표는 단순히 GPT를 복제하는 것이 아니다. 라마는 오픈AI(OpenAI)의 챗GPT, 구글의 람다(LaMDA) 등 경쟁 기업의 기술보다 작고 성능이 뛰어나면서 동일한 이해력을 실행하도록 개발됐다. 컴퓨팅 측면에서도 차지하는 공간이 작고 실행비용도 비교적 저렴하다는 것도 장점이다.

특히 메타는 라마를 ‘개방형’으로 만들었다고 강조하며, 기업의 이름과는 반대로 기술을 ‘오픈’하지 않은 오픈AI를 암시적으로 지적했다.

대규모 언어모델의 최근 발전에도 불구하고 그러한 모델을 교육하고 실행하는 데 필요한 리소스로 인해 전체 연구 액세스는 여전히 제한적이다. 이 제한된 액세스는 대규모 언어모델이 작동하는 방식과 이유를 이해하는 연구원의 능력을 제한하고 있다.

메타는 라마용 코드를 공유함으로써 다른 연구자들이 대규모 언어모델에서 이러한 문제를 제한하거나 제거하는 새로운 접근 방식으로 더욱 쉽게 테스트할수 있도록 했다. 메타는 연구원이 사용할수 있는 라마를 출시함으로써 학술 AI연구의 한계로 지적받아온 LLM을 교육하는 막대한 비용을 축소했다.

3년전 기준 GPT-3의 각 교육 실행비용은 1000만달러(약 130억3000만원)에서 1200만달러(156억 3600만원) 사이로 추정됐다. 오픈AI는 실제 비용을 공개하지 않고 개별 실행에 사용된 컴퓨팅 양만 공개했다. 또한 해당 분야의 시행착오 특성을 감안할 때 올바른 실행에 필요한 실행 횟수도 공개하지 않았다.

반면 메타는 효율성에 중점을 두어 시스템 운영 비용을 낮췄다. 가장 발전된 라마 모델은 650억개의 매개변수로, GPT-3의 가장 큰 크기의 3분의 1에 불과하지만 기능면에서 거의 동일한 것으로 평가받고 있다. 이렇게 축소된 크기는 라마를 훨씬 더 저렴하게, 심지어 데스크톱 컴퓨터에서도 실행할 수 있음을 의미한다.

문제는 누구나 다운로드할 수 있도록 전체 모델이 유출되면서 시작됐다. 최초 포챈(4Chan)에 게시된 라마는 비트토렌트를 통해 퍼졌고 결국 무료 깃 저장소인 깃허브(GitHub)에 게시됐다. 이를 게시한 사용자는 다른 사용자들에게 ‘대역폭을 절약’을 위해 해당 링크를 사용하도록 권장하는 메모를 추가하기도 했다.

이번 유출이 어떤 영향을 미칠지 말하기에는 너무 이를수 있다. 현재 이 모델을 사용하기 위해 심각한 기술적 결함을 안고 극도로 강력한 컴퓨터 또는 클라우드 스토리지 청구서에 엄청난 비용을 쓸 의지가 없다면 실질적으로 사용할 수는 없기 때문이다.

라마 유출에 메타의 반응도 불분명하다. 메타가 변호사를 통해 ‘지니를 다시 병속에 집어넣을 것’인지, 아니면 라마가 세계에서 가장 널리 배포된 AI가 될 가능성이 있는 이번 상황을 지켜보며 개발자로서의 우연한 역할을 받아들인 것인지 아직 모르기 때문이다.

이번 라마 유출에 우리는 현재 매우 다른 두 가지 AI 미래의 교차로에 서 있다. 하나는 이러한 모델을 교육하고 개선하는 데 수십억 달러를 투자하는 회사가 게이트키퍼 역할을 하며 모델이 가능하게 하는 경제 활동의 일부를 차단하는 것이다. 예를 들어 챗GPT를 기반으로 비즈니스를 구축하고 싶다면 비용을 지불하면 된다.

다른 하나는 AI 모델을 누구나 접근할수 있도록 구축하는 것이다. 혜택의 일부는 여전히 전문 지식과 서비스를 판매할 수 있는 위치에 있는 개발자에게 발생하지만, 일부는 인프라 공급자에 의해 더 많은 혜택을 받는다. 그러나 게이트키퍼가 줄어들면서 경제적 이점이 훨씬 더 확산된다. 두가지 미래 모두 장·단점이 있다.

라마 유출후 메타 대변인은 “최첨단 AI 모델을 연구 커뮤니티 구성원과 공유하여 해당 모델을 평가하고 개선하는 데 도움을 주는 것이 메타의 목표”라고 말했다. 또한 대변인은 “라마는 이전의 대규모 언어모델을 공유한 방식과 마찬가지로 연구 목적으로 공유됐다”며 “모든 사람이 모델에 액세스할수 없고 일부는 승인 프로세스를 우회하려고 시도했지만 현재 릴리스 전략을 통해 기업이 책임과 개방성의 균형을 유지할 수 있다고 본다”고 설명했다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[인터뷰] 김민석 로켓툴즈 대표 “데이터 수집과 분석, CRM까지 자동으로 하는 ‘AI 마케터’를 만들고 있습니다”

로켓툴즈는 퍼스트파티데이터를 분석하고 고품질 데이터로 추출해 정합성을 높이는 단계는 물론 CRM 마케팅에 필요한 타깃 정의, 콘텐츠 제작, 세팅, 결과 분석까지 제공하는 솔루션을 개발하고 있다. 여기에 더해 고객이 회원 가입시 쿠폰을 발급하고 자사몰에 접속했을 때 뜨는 팝업, 구매 유도를 위한 카카오톡 알림톡까지 자동으로 연계될 수 있도록 한다는 것이다. 이름하여 ‘AI 마케터’다.

달에서 문자하고 화성에서 스트리밍할까요?

달 탐험을 강화하고 궁극적으로 위성 행성에 인간이 존재할수 있는 미래를 모색하기 위해 NASA와 노키아가 올해 말, 달에서 4G 모바일 네트워크를 출시할 준비를 진행중이다. 이는 우주 식민지 주민이 개인 디바이스를 네트워크에 연결해 지구인이 사용하는 모든 앱과 서비스에 액세스할수 있는 스마트폰을 사용할 수 있다는 것을 의미한다.

서울대생들이 만든 소셜 스타트업, ‘시공간’ “LLM 활용, 대화형 챗봇으로 시각장애인의 온라인 쇼핑을 돕는 서비스 만들었습니다”

시공간이 개발·출시한 서비스는 총 세 가지다. 우선 대표 서비스인 ‘픽포미’를 들 수 있다. 이는 시각장애인을 위한 쇼핑 서비스로 다양한 상품 정보를 LLM(거대언어모델) 기반 AI로 요약해 시각장애인들에게 제공하는 것이 특징이다. 또 ‘브로디’는 시각장애인을 위한 사진 해설 서비스로, ‘글공방’은 자체적으로 시각장애인을 위한 대체텍스트 제작이 어려운 기업들을 위한 ‘대체텍스트 제작’ B2B 서비스로 고도화를 진행 중이다.

AI의 파괴적 혁신···2D 레이더 지도를 몇분만에 3D지도로

최근 전세계적으로 지진 발생 소속이 부쩍 잦아진 것 같다. 요 근래만 해도 일본 근해의 지진이 있고 뉴욕지진, 대만 지진이 세계를 놀라게 했다. 이런 지진이 발생했을 때 도시지역이라면 재난 발생지역을 입체적으로 보여주는 3D지도가 긴요해진다. 때마침 IEEE스펙트럼은 독일 뮌헨 분데스베어대학교가 이런 지도 제작을 단 몇 분 만에 만들어줄 인공지능(AI) 모델을 개발했다.