‘오픈AI Vs. 오픈AI’ 메타의 ‘라마’ 유출이 던진 질문

[AI요약] 메타의 대규모 언어모델 라마의 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. 기술기업으로부터 강력하게 통제되는 기술이냐, 누구나 접근가능한 기술이냐, 우리는 AI 미래를 위한 교차로에 서 있다.

메타 라마의 이번 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. (이미지=메타)

최근 메타(Meta)가 공개한 GPT 스타일의 인공지능(AI) 언어모델 ‘라마’(LLaMA)의 대규모 유출 현황과 전망에 대해 더가디언, 더버지 등 외신이 보도했다.

메타의 목표는 단순히 GPT를 복제하는 것이 아니다. 라마는 오픈AI(OpenAI)의 챗GPT, 구글의 람다(LaMDA) 등 경쟁 기업의 기술보다 작고 성능이 뛰어나면서 동일한 이해력을 실행하도록 개발됐다. 컴퓨팅 측면에서도 차지하는 공간이 작고 실행비용도 비교적 저렴하다는 것도 장점이다.

특히 메타는 라마를 ‘개방형’으로 만들었다고 강조하며, 기업의 이름과는 반대로 기술을 ‘오픈’하지 않은 오픈AI를 암시적으로 지적했다.

대규모 언어모델의 최근 발전에도 불구하고 그러한 모델을 교육하고 실행하는 데 필요한 리소스로 인해 전체 연구 액세스는 여전히 제한적이다. 이 제한된 액세스는 대규모 언어모델이 작동하는 방식과 이유를 이해하는 연구원의 능력을 제한하고 있다.

메타는 라마용 코드를 공유함으로써 다른 연구자들이 대규모 언어모델에서 이러한 문제를 제한하거나 제거하는 새로운 접근 방식으로 더욱 쉽게 테스트할수 있도록 했다. 메타는 연구원이 사용할수 있는 라마를 출시함으로써 학술 AI연구의 한계로 지적받아온 LLM을 교육하는 막대한 비용을 축소했다.

3년전 기준 GPT-3의 각 교육 실행비용은 1000만달러(약 130억3000만원)에서 1200만달러(156억 3600만원) 사이로 추정됐다. 오픈AI는 실제 비용을 공개하지 않고 개별 실행에 사용된 컴퓨팅 양만 공개했다. 또한 해당 분야의 시행착오 특성을 감안할 때 올바른 실행에 필요한 실행 횟수도 공개하지 않았다.

반면 메타는 효율성에 중점을 두어 시스템 운영 비용을 낮췄다. 가장 발전된 라마 모델은 650억개의 매개변수로, GPT-3의 가장 큰 크기의 3분의 1에 불과하지만 기능면에서 거의 동일한 것으로 평가받고 있다. 이렇게 축소된 크기는 라마를 훨씬 더 저렴하게, 심지어 데스크톱 컴퓨터에서도 실행할 수 있음을 의미한다.

문제는 누구나 다운로드할 수 있도록 전체 모델이 유출되면서 시작됐다. 최초 포챈(4Chan)에 게시된 라마는 비트토렌트를 통해 퍼졌고 결국 무료 깃 저장소인 깃허브(GitHub)에 게시됐다. 이를 게시한 사용자는 다른 사용자들에게 ‘대역폭을 절약’을 위해 해당 링크를 사용하도록 권장하는 메모를 추가하기도 했다.

이번 유출이 어떤 영향을 미칠지 말하기에는 너무 이를수 있다. 현재 이 모델을 사용하기 위해 심각한 기술적 결함을 안고 극도로 강력한 컴퓨터 또는 클라우드 스토리지 청구서에 엄청난 비용을 쓸 의지가 없다면 실질적으로 사용할 수는 없기 때문이다.

라마 유출에 메타의 반응도 불분명하다. 메타가 변호사를 통해 ‘지니를 다시 병속에 집어넣을 것’인지, 아니면 라마가 세계에서 가장 널리 배포된 AI가 될 가능성이 있는 이번 상황을 지켜보며 개발자로서의 우연한 역할을 받아들인 것인지 아직 모르기 때문이다.

이번 라마 유출에 우리는 현재 매우 다른 두 가지 AI 미래의 교차로에 서 있다. 하나는 이러한 모델을 교육하고 개선하는 데 수십억 달러를 투자하는 회사가 게이트키퍼 역할을 하며 모델이 가능하게 하는 경제 활동의 일부를 차단하는 것이다. 예를 들어 챗GPT를 기반으로 비즈니스를 구축하고 싶다면 비용을 지불하면 된다.

다른 하나는 AI 모델을 누구나 접근할수 있도록 구축하는 것이다. 혜택의 일부는 여전히 전문 지식과 서비스를 판매할 수 있는 위치에 있는 개발자에게 발생하지만, 일부는 인프라 공급자에 의해 더 많은 혜택을 받는다. 그러나 게이트키퍼가 줄어들면서 경제적 이점이 훨씬 더 확산된다. 두가지 미래 모두 장·단점이 있다.

라마 유출후 메타 대변인은 “최첨단 AI 모델을 연구 커뮤니티 구성원과 공유하여 해당 모델을 평가하고 개선하는 데 도움을 주는 것이 메타의 목표”라고 말했다. 또한 대변인은 “라마는 이전의 대규모 언어모델을 공유한 방식과 마찬가지로 연구 목적으로 공유됐다”며 “모든 사람이 모델에 액세스할수 없고 일부는 승인 프로세스를 우회하려고 시도했지만 현재 릴리스 전략을 통해 기업이 책임과 개방성의 균형을 유지할 수 있다고 본다”고 설명했다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[인터뷰] 문인욱 덴탈콜 대표 “‘AI 상담사’로 치과 환자 관리의 판을 바꾸고 있습니다”

덴탈콜은 이미 10만건 이상의 상담 데이터를 바탕으로 치과별 맞춤형 대응 프로세스를 구현하고, 온프레미스(On-premise, 데이터를 외부 클라우드가 아니라 병원 내부 환경이나 별도 서버에서 처리하는 구축 방식) 기반 연동으로 의료 데이터 보안 문제에 대응하고 있다. 국내에서는 치과 시장에 집중하고, 동남아에서는 병·의원 전반으로 확장하는 전략도 병행하고 있다.

"페달 밟으면 0.01초 만에 반응"… 중국이 전기차로 세계를 먹는 이유

2025년 중국에서 신차 두 대 중 한 대 이상이 전기차였다. 12월 기준 신에너지차 점유율 59.1%, 연간으로는 54%를 기록했다. 전 세계가...

[현장] 이관우 버즈빌 대표 “제로클릭 시대, 광고의 진짜 전장은 노출 이후”… 대응법은 ‘인터랙션 AI 에이전트’

이번에 공개된 다이내믹 트리오 엔진은 세 가지 AI 모듈로 구성된다. 사용자별로 반응 가능성이 높은 광고 소재를 자동 매칭하고 개선하는 ‘다이내믹 크리에이티브’, 사용자의 몰입 순간과 이탈 징후를 실시간으로 포착해 다음 행동을 설계하는 ‘다이내믹 멀티미션’, 이탈 직전 맞춤 혜택을 집중 투입하면서 어뷰징 가능성은 자동 차단하는 ‘다이내믹 리워드’가 그것이다. 버즈빌은 이 세 모듈을 타겟팅 AI와 결합해 누구에게, 어떤 형식으로, 어떤 혜택과 함께 광고를 전달할지를 수 초 안에 결정하는 구조를 구축했다.

[인터뷰] “광고비는 쓰는데 계약은 왜 안 늘까”… 하아얀 수파리드 대표 “고관여 B2C 시장의 빈틈을 아세요?”

하아얀 수파리드 대표. 최종 매출을 만든 광고 채널과 소재가 무엇인지는 AI 시대에 접어들었다고 하는 요즘도 고관여 B2C 비즈니스 영역에서는 여전히 깜깜이 구간으로 치부돼 왔다. 수파리드는 이러한 문제를 해결하겠다고 나선 스타트업이다. (사진=테크42)