‘오픈AI Vs. 오픈AI’ 메타의 ‘라마’ 유출이 던진 질문

[AI요약] 메타의 대규모 언어모델 라마의 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. 기술기업으로부터 강력하게 통제되는 기술이냐, 누구나 접근가능한 기술이냐, 우리는 AI 미래를 위한 교차로에 서 있다.

메타 라마의 이번 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. (이미지=메타)

최근 메타(Meta)가 공개한 GPT 스타일의 인공지능(AI) 언어모델 ‘라마’(LLaMA)의 대규모 유출 현황과 전망에 대해 더가디언, 더버지 등 외신이 보도했다.

메타의 목표는 단순히 GPT를 복제하는 것이 아니다. 라마는 오픈AI(OpenAI)의 챗GPT, 구글의 람다(LaMDA) 등 경쟁 기업의 기술보다 작고 성능이 뛰어나면서 동일한 이해력을 실행하도록 개발됐다. 컴퓨팅 측면에서도 차지하는 공간이 작고 실행비용도 비교적 저렴하다는 것도 장점이다.

특히 메타는 라마를 ‘개방형’으로 만들었다고 강조하며, 기업의 이름과는 반대로 기술을 ‘오픈’하지 않은 오픈AI를 암시적으로 지적했다.

대규모 언어모델의 최근 발전에도 불구하고 그러한 모델을 교육하고 실행하는 데 필요한 리소스로 인해 전체 연구 액세스는 여전히 제한적이다. 이 제한된 액세스는 대규모 언어모델이 작동하는 방식과 이유를 이해하는 연구원의 능력을 제한하고 있다.

메타는 라마용 코드를 공유함으로써 다른 연구자들이 대규모 언어모델에서 이러한 문제를 제한하거나 제거하는 새로운 접근 방식으로 더욱 쉽게 테스트할수 있도록 했다. 메타는 연구원이 사용할수 있는 라마를 출시함으로써 학술 AI연구의 한계로 지적받아온 LLM을 교육하는 막대한 비용을 축소했다.

3년전 기준 GPT-3의 각 교육 실행비용은 1000만달러(약 130억3000만원)에서 1200만달러(156억 3600만원) 사이로 추정됐다. 오픈AI는 실제 비용을 공개하지 않고 개별 실행에 사용된 컴퓨팅 양만 공개했다. 또한 해당 분야의 시행착오 특성을 감안할 때 올바른 실행에 필요한 실행 횟수도 공개하지 않았다.

반면 메타는 효율성에 중점을 두어 시스템 운영 비용을 낮췄다. 가장 발전된 라마 모델은 650억개의 매개변수로, GPT-3의 가장 큰 크기의 3분의 1에 불과하지만 기능면에서 거의 동일한 것으로 평가받고 있다. 이렇게 축소된 크기는 라마를 훨씬 더 저렴하게, 심지어 데스크톱 컴퓨터에서도 실행할 수 있음을 의미한다.

문제는 누구나 다운로드할 수 있도록 전체 모델이 유출되면서 시작됐다. 최초 포챈(4Chan)에 게시된 라마는 비트토렌트를 통해 퍼졌고 결국 무료 깃 저장소인 깃허브(GitHub)에 게시됐다. 이를 게시한 사용자는 다른 사용자들에게 ‘대역폭을 절약’을 위해 해당 링크를 사용하도록 권장하는 메모를 추가하기도 했다.

이번 유출이 어떤 영향을 미칠지 말하기에는 너무 이를수 있다. 현재 이 모델을 사용하기 위해 심각한 기술적 결함을 안고 극도로 강력한 컴퓨터 또는 클라우드 스토리지 청구서에 엄청난 비용을 쓸 의지가 없다면 실질적으로 사용할 수는 없기 때문이다.

라마 유출에 메타의 반응도 불분명하다. 메타가 변호사를 통해 ‘지니를 다시 병속에 집어넣을 것’인지, 아니면 라마가 세계에서 가장 널리 배포된 AI가 될 가능성이 있는 이번 상황을 지켜보며 개발자로서의 우연한 역할을 받아들인 것인지 아직 모르기 때문이다.

이번 라마 유출에 우리는 현재 매우 다른 두 가지 AI 미래의 교차로에 서 있다. 하나는 이러한 모델을 교육하고 개선하는 데 수십억 달러를 투자하는 회사가 게이트키퍼 역할을 하며 모델이 가능하게 하는 경제 활동의 일부를 차단하는 것이다. 예를 들어 챗GPT를 기반으로 비즈니스를 구축하고 싶다면 비용을 지불하면 된다.

다른 하나는 AI 모델을 누구나 접근할수 있도록 구축하는 것이다. 혜택의 일부는 여전히 전문 지식과 서비스를 판매할 수 있는 위치에 있는 개발자에게 발생하지만, 일부는 인프라 공급자에 의해 더 많은 혜택을 받는다. 그러나 게이트키퍼가 줄어들면서 경제적 이점이 훨씬 더 확산된다. 두가지 미래 모두 장·단점이 있다.

라마 유출후 메타 대변인은 “최첨단 AI 모델을 연구 커뮤니티 구성원과 공유하여 해당 모델을 평가하고 개선하는 데 도움을 주는 것이 메타의 목표”라고 말했다. 또한 대변인은 “라마는 이전의 대규모 언어모델을 공유한 방식과 마찬가지로 연구 목적으로 공유됐다”며 “모든 사람이 모델에 액세스할수 없고 일부는 승인 프로세스를 우회하려고 시도했지만 현재 릴리스 전략을 통해 기업이 책임과 개방성의 균형을 유지할 수 있다고 본다”고 설명했다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

모르면 손해! 3억 구독자 등에 업은 ‘넷플릭스 무료게임’ 최신 리스트

넷플릭스가 넷플릭스게임즈를 키우기 위해 에픽게임즈의 인재를 영입하면서 곧 기업에 상당한 움직임이 있을 것으로 예상되고 있다. 올해 초 넷플릭스게임즈는 2024년 로드맵을 발표했으며, 여기에는 스트리밍 플랫폼을 통해 액세스할 수 있는 최대 14개의 새로운 게임이 포함돼 있다.

도대체 왜?···머스크의 트럼프 지지 속내 3가지

일론 머스크는 트럼프가 미 대통령에 당선되더라도 바이든 행정부에서 겪은 푸대접 대신 오히려 최소 3가지 이익을 기대하며 그를 지지했을 것으로 보인다. (물론 기본적으로 머스크는 트럼프와 ‘배짱이 맞아서’ 지지했을 것이다.) 그 3가지는 ▲바이든 행정부의 전기차 보조금 공제법 폐지시에도 자사의 보급경 전기차(모델 3)는 경쟁력있다는 점 ▲바이든 행정부가 머스크와 테슬라에 보인 푸대접을 더 이상 받지 않을 것이라는 점 ▲바이든 행정부가 테슬라 자율주행 기술을 예의주시하며 잠재적으로 증권과 전신 사기 혐의로 이어질 수 있는 조사 개시를 회피할 수 있으리란 기대감이다.

[AGI 콘퍼런스 2024] 김동신 센드버드 대표 “AI 챗봇 서비스 도입의 목적은 개인화된 고객 커뮤니케이션 자동화, 사용자 경험 극대화입니다”

김동신 센드버드 대표는 “바퀴를 재발명하지 않는 것이 중요하다”고 강조했다. AI 서비스 개발 시 이런저런 시도로 시행착오를 거치는 과정이 불가피하지만 결국 ‘사업적 성과’로 이어지도록 빨리 시장에 선보이고 개선하는 작업을 진행해야 한다는 것이다.

‘웨이모 Vs 크루즈 Vs 사이버캡’ 미국의 ‘로보택시’ 삼파전

제너럴모터스의 자율주행차 사업부인 크루즈가 도시에서 운행하도록 설계된 자율주행 셔틀 오리진의 생산을 무기한 연기 발표하자 알파벳은 자사의 자율주행차 사업부인 웨이모에 대대적인 투자를 발표했다. 테슬라 역시 전용 로봇택시인 사이버캡 공개 계획을 미루면서, 웨이모의 미국 로보택시 시장 선점에 청신호가 켜졌다.