유출된 ‘구글 엔지니어의 메모’에 담긴 불편한 진실

[AI요약] 최근 구글 엔지니어의 메모가 유출되면서 실리콘밸리에 퍼져있었던 우려가 수면 위로 떠올랐다. 대중에게 AI기술을 공개하는 오픈소스로 인해 결국 빅테크는 AI 경쟁에서 패배하리라는 것이다. 엄청난 규모의 돈을 투입해 AI 기술을 개발한 빅테크의 딜레마가 시작됐다.

구글의 고위급 엔지니어의 메모가 유출돼 파장이 되고 있다.(사진=위키피디아)

빅테크는 오픈소스 커뮤니티로 인해 결국 AI경쟁에서 패배하게 될까.

막대한 자금이 투입되는 빅테크의 AI기술과 모든 사람에게 공개되는 오픈소스의 향방에 대해 더가디언, NBCN 등 외신이 10일(현지시간) 보도했다.

최근 유출된 구글 엔지니어의 메모는 실리콘밸리를 장악하고 있는 대담한 주장을 대변하고 있다. 인공지능 분야에서 빅테크의 이점이 빠르게 줄어들고 있다는 것이다. 구글 대변인은 해당 메모가 사실임을 확인했지만, 기업 전체를 대변한 것이 아닌 한 고위 직원의 의견이라고 해명한 상태다.

기술시장분석기업 세미애널리시스의 웹사이트에 게시된 해당 메모는 미국에서 인기 있는 헤커뉴스 게시판과 260만명 이상의 회원을 보유한 레딧의 한 커뮤니티에 게시되는 등 AI 업계의 뜨거운 이슈가 되고 있다.

해당 메모에는 “우리는 오픈AI의 어깨너머로 많은 것을 살펴보았다. 하지만 불편한 진실은 우리가 이 군비 경쟁에서 이길 위치에 있지 않으며 이는 오픈AI도 마찬가지라는 것이다.”라고 적혀있다. 이어 “물론 오픈소스에 대해 이야기다. 간단히 말해서 그들은 우리를 랩핑하고 있다. 우리 모델이 품질 면에서 여전히 약간 우위에 있지만, 격차는 놀라울 정도로 빠르게 좁혀지고 있다.”라고 우려했다.

위기의식의 시작은 빅테크가 AI를 개발하는 데 수년을 보내고 있는 가운데 등장한 오픈AI의 챗GPT(ChatGPT)다. 이후 사용자의 프롬프트를 기반으로 콘텐츠를 생성할수 있는 또다른 생성 AI시스템의 인기와 품질이 급증하기 시작했다. 오픈AI는 지난 1월 구글의 경쟁기업인 마이크로소프트와 대규모 거래를 발표했으며, 이에 대응해 구글은 바드(Bard)를 서둘러 출시했다.

마이크로소프트, 구글 등 빅테크는 AI를 기존 비즈니스의 많은 부분으로 통합하기 위한 노력을 진행중이지만, 그렇다고 해서 이들 기업이 기술 산업에 대한 지배력을 더욱 강화하게 될것이라는 의미는 아니다.

해당 메모에서 구글 직원은 구글과 마이크로소프트가 작지만 더 효율적인 프로젝트를 만들기 위해 공개적으로 이용 가능한 AI코드와 모델, 즉 오픈소스에 의존하는 프로그래머와 빠르게 성장중인 커뮤니티를 소홀히 해왔다고도 적혀있다.

업계 전문가와 분석가는 해당 메모의 경고에 동의하고 있는 분위기다. 지난 2월에 회사에 다시 합류한 오픈AI 설립자 안드레이 카르파티는 최근 트위터를 통해 “기술 대기업과 경쟁하는 소규모 AI 기업의 급증이 업계를 크게 뒤흔들기 시작했다”고 트윗했다. 이어 그는 “생태계는 캄브리아기 폭발의 초기 징후를 경험하고 있다”며 5억년전 생명의 빠르고 다양한 진화로 특징지어지는 지구 역사의 한 시기를 비유했다.

오픈소스는 누구나 빌드하거나 사용자 정의할수 있도록 공개적으로 릴리스된 소프트웨어 코드를 말한다. 대부분의 빅테크는 내부 프로그램을 회사 기밀로 철저히 유지하지만 오픈소스 커뮤니티는 서로 공유하고 수정하며 협력한다. 인기 있는 오픈소스 프로그램에는 파이어폭스(Firefox) 브라우저와 VLC 미디어 플레이어가 포함된다.

오픈소스 AI 커뮤니티는 올해초 무기명의 사용자가 메타의 챗GPT에 해당하는 ‘라마’(LLaMa)를 메시지 보드 포첸(4chan)에 유출하면서 거대하고 예상치 못한 선물을 받았다. 당시 라마는 대중에게 공식적으로 소개되지 않은 상태였다.

이 유출로 인해 오픈소스 AI 프로그래머는 자신만의 맞춤형 프로젝트를 위한 기반을 마련하기 시작했다. 이들은 “AI는 누구나 가지고 놀수 있기때문에 멈출수 없으며, 가드레일과 모라토리아에 대한 논의는 학문적일 뿐이다”라는 입장을 공고히 했다.

핵심은 한때 소규모 개발자의 주요 과제로 여겨졌던 AI 시스템을 교육하는데 필요한 데이터의 양이다. 프로그래머이자 기술 분석가인 사이먼 윌리슨는 “오픈AI의 주력 제품인 챗GPT-4가 여전히 업계를 주도하고 있지만 모든 AI 제품이 지금까지 있었던 방대한 데이터를 기반으로 구축될 필요는 없다”고 언론을 통해 밝혔다.

현재 오픈소스 커뮤니티는 유용하면서도 ‘작은’ AI 모델 개발을 빠르게 파악중이다. 그러나 개별 프로그래머에게 양도된 AI 이점이 사회이익을 위한 기술 민주화에 기여할 가능성도 있지만, 악의적인 사용될수 있다는 우려도 나온다.

마크 리들 조지아공과대학교 교수는 “대중은 기업이 독점으로 모든 것을 통제하는 것을 원하지 않는다”며 “이러한 도구를 더 많은 사람의 손에 쥐어줌으로써 더 높은 수준의 창의성을 보게 될 것이라고 믿는다”고 설명했다.

그는 “이제는 대중이 새로운 기술을 무엇에 사용할 것인지 질문해야될 시기”라며 “오픈소스는 독성물질을 생성하거나 잘못된 정보를 생성해 가짜뉴스를 만드는 등 모델의 특수 버전을 개발하는데 제한이 없다”고 지적했다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

‘테크 이지 토크’ 첫 번째 시간… LLM의 미래와 교육의 변화

산업 각 분야에서 초거대언어모델(LLM, Large Language Model)을 활용한 기술과 서비스가 앞다퉈 등장하고 있다. 과연 LLM의 강점과 한계는 무엇일까? 그리고 여러...

‘챗GPT’ 뉴 버전 ‘섹시한 페르소나’는 마음에 드나요?

스칼렛 요한슨이 디지털 동반자의 목소리를 맡은 영화 이 실제로 구현됐다. 오픈AI는 섹시한 여성 목소리의 인공지능 대규모 언어모델 ‘GPT-4o’를 새롭게 공개했다. 기업이 끊임없이 강조하는 대로 챗GPT는 미래를 건설하고 있는 것일까.

[인터뷰] 매도왕 정철민 대표·임주성 CTO “1년 동안 안 팔렸던 매물, 두 달만에 팔리는 부동산 솔루션을 개발했습니다”

‘프롭테크(PropTech, 부동산에 기술을 결합한 서비스)’를 내세운 다양한 서비스가 생겨나고 있지만, 정작 매수자나 세입자 중심의 서비스가 대부분을 차지하고 있는 것도 한계점으로 작용하고 있다. 이러한 상황에서 지난달 초 엔틀러 코리아의 액셀러레이팅 프로그램을 통해 탄생한 신생 스타트업 ‘매도왕’은 그 사명과 같이 매도인 입장에서 부동산 매물이 잘 팔릴 수 있는 솔루션을 제시하며 주목받고 있다.

[인터뷰] 최원상 에어벌룬 대표 “개인 온라인 비즈니스를 거래할 수 있는 마켓플레이스를 만들고 있습니다”

‘개인 간의 온라인 비즈니스 매매를 안전하게 할 수 있는 마켓플레이스가 있다면 어떨까?’ 최원상 에어벌룬 대표의 이러한 아이디어는 앤틀러 코리아의 액셀러레이팅 프로그램을 통해 현실화됐고, 단기간에 적잖은 거래량을 발생시키며 그 가능성을 입증하고 있다. 지난달 초 6개월 간의 프로그램 과정을 마치고 ‘3기 INVESTOR DAY: Zero to One’을 통해 IR 발표를 한지 한 달여, 최 대표를 만나 그의 지난 이야기와 에어벌룬 팀이 만들어 내고 있는 성과, 향후 로드맵에 대해 물어봤다.