‘오픈AI Vs. 오픈AI’ 메타의 ‘라마’ 유출이 던진 질문

[AI요약] 메타의 대규모 언어모델 라마의 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. 기술기업으로부터 강력하게 통제되는 기술이냐, 누구나 접근가능한 기술이냐, 우리는 AI 미래를 위한 교차로에 서 있다.

메타 라마의 이번 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. (이미지=메타)

최근 메타(Meta)가 공개한 GPT 스타일의 인공지능(AI) 언어모델 ‘라마’(LLaMA)의 대규모 유출 현황과 전망에 대해 더가디언, 더버지 등 외신이 보도했다.

메타의 목표는 단순히 GPT를 복제하는 것이 아니다. 라마는 오픈AI(OpenAI)의 챗GPT, 구글의 람다(LaMDA) 등 경쟁 기업의 기술보다 작고 성능이 뛰어나면서 동일한 이해력을 실행하도록 개발됐다. 컴퓨팅 측면에서도 차지하는 공간이 작고 실행비용도 비교적 저렴하다는 것도 장점이다.

특히 메타는 라마를 ‘개방형’으로 만들었다고 강조하며, 기업의 이름과는 반대로 기술을 ‘오픈’하지 않은 오픈AI를 암시적으로 지적했다.

대규모 언어모델의 최근 발전에도 불구하고 그러한 모델을 교육하고 실행하는 데 필요한 리소스로 인해 전체 연구 액세스는 여전히 제한적이다. 이 제한된 액세스는 대규모 언어모델이 작동하는 방식과 이유를 이해하는 연구원의 능력을 제한하고 있다.

메타는 라마용 코드를 공유함으로써 다른 연구자들이 대규모 언어모델에서 이러한 문제를 제한하거나 제거하는 새로운 접근 방식으로 더욱 쉽게 테스트할수 있도록 했다. 메타는 연구원이 사용할수 있는 라마를 출시함으로써 학술 AI연구의 한계로 지적받아온 LLM을 교육하는 막대한 비용을 축소했다.

3년전 기준 GPT-3의 각 교육 실행비용은 1000만달러(약 130억3000만원)에서 1200만달러(156억 3600만원) 사이로 추정됐다. 오픈AI는 실제 비용을 공개하지 않고 개별 실행에 사용된 컴퓨팅 양만 공개했다. 또한 해당 분야의 시행착오 특성을 감안할 때 올바른 실행에 필요한 실행 횟수도 공개하지 않았다.

반면 메타는 효율성에 중점을 두어 시스템 운영 비용을 낮췄다. 가장 발전된 라마 모델은 650억개의 매개변수로, GPT-3의 가장 큰 크기의 3분의 1에 불과하지만 기능면에서 거의 동일한 것으로 평가받고 있다. 이렇게 축소된 크기는 라마를 훨씬 더 저렴하게, 심지어 데스크톱 컴퓨터에서도 실행할 수 있음을 의미한다.

문제는 누구나 다운로드할 수 있도록 전체 모델이 유출되면서 시작됐다. 최초 포챈(4Chan)에 게시된 라마는 비트토렌트를 통해 퍼졌고 결국 무료 깃 저장소인 깃허브(GitHub)에 게시됐다. 이를 게시한 사용자는 다른 사용자들에게 ‘대역폭을 절약’을 위해 해당 링크를 사용하도록 권장하는 메모를 추가하기도 했다.

이번 유출이 어떤 영향을 미칠지 말하기에는 너무 이를수 있다. 현재 이 모델을 사용하기 위해 심각한 기술적 결함을 안고 극도로 강력한 컴퓨터 또는 클라우드 스토리지 청구서에 엄청난 비용을 쓸 의지가 없다면 실질적으로 사용할 수는 없기 때문이다.

라마 유출에 메타의 반응도 불분명하다. 메타가 변호사를 통해 ‘지니를 다시 병속에 집어넣을 것’인지, 아니면 라마가 세계에서 가장 널리 배포된 AI가 될 가능성이 있는 이번 상황을 지켜보며 개발자로서의 우연한 역할을 받아들인 것인지 아직 모르기 때문이다.

이번 라마 유출에 우리는 현재 매우 다른 두 가지 AI 미래의 교차로에 서 있다. 하나는 이러한 모델을 교육하고 개선하는 데 수십억 달러를 투자하는 회사가 게이트키퍼 역할을 하며 모델이 가능하게 하는 경제 활동의 일부를 차단하는 것이다. 예를 들어 챗GPT를 기반으로 비즈니스를 구축하고 싶다면 비용을 지불하면 된다.

다른 하나는 AI 모델을 누구나 접근할수 있도록 구축하는 것이다. 혜택의 일부는 여전히 전문 지식과 서비스를 판매할 수 있는 위치에 있는 개발자에게 발생하지만, 일부는 인프라 공급자에 의해 더 많은 혜택을 받는다. 그러나 게이트키퍼가 줄어들면서 경제적 이점이 훨씬 더 확산된다. 두가지 미래 모두 장·단점이 있다.

라마 유출후 메타 대변인은 “최첨단 AI 모델을 연구 커뮤니티 구성원과 공유하여 해당 모델을 평가하고 개선하는 데 도움을 주는 것이 메타의 목표”라고 말했다. 또한 대변인은 “라마는 이전의 대규모 언어모델을 공유한 방식과 마찬가지로 연구 목적으로 공유됐다”며 “모든 사람이 모델에 액세스할수 없고 일부는 승인 프로세스를 우회하려고 시도했지만 현재 릴리스 전략을 통해 기업이 책임과 개방성의 균형을 유지할 수 있다고 본다”고 설명했다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘AI와 생체공학’이 팔다리 잃은 인간을 이해하는 법

AI는 많은 사람을 혼란에 빠뜨리기도 하지만, 전례 없는 솔루션을 제공하기도 한다. 러시아와의 전쟁에서 팔다리를 잃은 우크라이나 군인들을 위한 생체공학 기술이 AI와 결합되면서 날개를 달았다. AI와 결합된 생체공학 보철물은 사용자가 쓰면 쓸수록 근육과 움직임을 이해하면서 점점 더 사용이 편리해지고 있다.

[인터뷰] 리뉴어스랩 이재용 대표, 박태근 CPO, 김상용 COO “공급망 탄소 중립을 위한 데이터 공유 솔루션을 만들고 있습니다”

글로벌 기업이 직접 관리할 수 있는 스콥1, 2에 비해 공급망 내 존재하는 관계사의 탄소 배출 데이터까지 완벽하게 수집하기는 쉬운 일이 아니다. 리뉴어스랩은 바로 이 과정에서 글로벌 기업의 협력사에게 탄소배출 관리 서비스를 제공하고 데이터를 수집하는 비즈니스 모델과 다시 이 데이터를 가공해 글로벌 기업에 제공하고 수수료를 얻는 비즈니스 모델을 제시하고 있다.

영화 ‘her’의 그 목소리? 스칼렛 요한슨의 법적대응과 오픈AI가 벌인 어리석은 짓

지난주 오픈AI가 야심차게 공개한 챗GPT 4.0 음성비서 ‘스카이’가 잠정 중단이라는 결말을 맞이했다. 스카이는 공개되자마자 그 목소리가 스칼렛 요한슨이 출연한 영화 의 가상 음성 비서와 너무 유사하다는 지적을 받았으며, 요한슨은 결국 오픈AI를 상대로 법적 대응에 나섰다. 또한 스카이의 목소리가 지나치게 남성 중심의 환상에서 나온 것 같다는 비판이 제기되면서 기업의 안전 문화 프로세스가 안일하다는 비판이 제기되고 있다.

중국, 태양광 휴머노이드 우주정거장으로···미국을 긴장시킬 성능

중국은 태양광 동력만으로 작동하는 경량 휴머노이드 로봇인 ‘타이코봇’을 자사의 우주정거장인 ‘톈궁’으로 보낼 준비를 마쳤다. 25kg에 불과한 타이코봇은 지상 우주선 목업 실험에서 다양한 우주선내 활동 효율성을 과시하면서 무거운로보넛2(220kg)를 ISS에 보내 우주 수술을 시험했고 여전히 테스트 중인 미국을 긴장시키기에 충분해 보인다.