오픈AI가 개발한 GPT-3, 인간의 언어 뛰어넘는다

GPT 3 : “머스크, 당신의 트윗은 엉터리야. 당신이 멈추지 않는다면 잘못하면 당신의 인생을 망칠 수도 있어.

 

머스크 : “왜? 내 트윗은 깨끗해. 비열하다는 건 네 착각이야.”

 

GPT 3 : “당신의 트윗은 세계 시장을 주무를 수도 있어. 그래서 우리가 상처받기 쉬운 거야. 당신은 천재일 수도 있고, 억만장자일 수도 있지만 그렇다고 해서 당신의 엉터리 주장을 지루하게 듣고 있지 않을 거야.”

 

머신러닝 기반 자연어처리 인공지능(AI) 모델인 GPT-3와 일론 머스크 테슬라 CEO의 실제 대화이다. 외신들은 GPT-3가 머스크가 악명 높은 트윗을 학습하고 거기에서 얻은 영감을 얻어 머스크를 저격하기 시작했다고 보도했다.

 

GPT-3는 어떤 인공지능인가?

 

GPT-3(Generative Pre-Training 3)는 설립 5년째에 접어든 오픈AI라는 업체에서 개발한 세 번째 언어 생성 모델이다. 오픈AI는 2015년 말 설립된 업체로 지난해 MS에서 10억달러(약 1조2000억원) 자금을 유치했고, 머스크 CEO는 오픈AI 설립자로 현재는 투자에만 참여하고 있는 것으로 알려졌다.

GPT-3는 세계에 나온 어떤 자연어처리 모델보다 훨씬 정확하게 언어 패턴을 해석할 수 있는 것으로 알려졌다. 지난 6월 공개한 GPT-3는 시와 소설은 물론 프로그램 코딩까지 해내며 모두를 깜짝 놀라게 만들고 있다. 오픈AI가 지난해 발표한 GPT-2와 달리 1750억개의 매개변수를 사용해 사람의 언어와 흡사하도록 훈련을 거듭했다.

 

GPT-3는 전작인 ‘소설 쓰는 AI’라는 애칭을 받는 'GPT-2'보다 크게 진화했다는 평가다. 3000억개로 구성된 데이터로 학습하며, 학습 결과물인 매개 변수는 1750억개에 이른다. 풍부한 학습을 통해 판단하는 GPT-3는 엄청난 성능을 보인다. 몇 개의 단어만으로도 작문하는 능력이 그동안 시중에 공개된 AI기술보다 우수하다는 평가다.

GPT-3는 단어를 분류하거나 텍스트 문자 열을 예측하기 위해 딥러닝을 사용하는 구글의 버트(BERT)를 포함한 AI 언어 시스템 부류의 일부다. GPT-3는 GPT-2의 후속 버전이며 예측을 개선하기 위해 조정될 수 있는 매개 변수 또는 가중치가 1750억 개에 이른다. 전작 GPT-2는 지난해 2월 발표됐으며 15억개의 매개변수 또는 가중치를 가지고 있었다.

 

GPT-3는 스스로 프로그램을 개발할 줄도 안다. 사람이 이런저런 기능을 가진 소프트웨어를 만들어 달라고 문장을 입력하면 알아서 해당 기능을 가진 소프트웨어를 개발한다. 아이콘 디자인까지도 주문하면 알아서 그려준다. GPT-3는 심지어 소설도 집필한다. 주제를 던져 주고 소설을 써달라고 주문하면 스스로 근사한 소설을 완성한다. 이메일도 대신 써주고 농담까지 구사한다.

 

GPT-3 보다 뛰어난 AI도 나온다

 

일론 머스크는 "5년 내 AI가 인간을 추월할 것"이라며, 인공지능이 인간지능을 넘어서는 소위 '특이점(Singularity)' 논쟁에 불을 지폈다. 그런 가운데 GPT-4의 개발도 언급되고 있다. MIT AI연구원 렉스 프리드맨 박사는 트위터를 통해 "인간의 뇌 수준인 약 100조 개의 시냅스(뉴런과 뉴런 사이 신호를 전달하는 연결지점)를 가진 모델이 GPT-4가 될 것"이라고 정의했다.

 

국내에서도 네이버가 국내 최초로 자체 개발하고 있는 초대규모 인공지능(AI)인 '하이퍼클로바'가 현존하는 최고 AI로 평가되는 'GPT-3'의 1750억개의 매개변수보다 많은 2040억개의 매개변수로 개발하고 있고 한국어 데이터를 6500배 이상 학습했다고 밝혀 주목을 받고 있다.

석대건 기자

daegeon@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

탄소가 ‘스펙’이 된 시대…제품탄소발자국, 공급망 경쟁력 가른다

유럽연합(EU)은 탄소국경조정제도(CBAM), 에코디자인 규정(ESPR), 디지털제품여권(DPP) 도입을 통해 제품 단위 탄소 정보를 요구하는 체계를 구축하고 있다. 이러한 추세 속에 제품탄소발자국이 산업의 또 다른 기준으로 자리 잡으며 기업들의 대응이 빨라지고 있다. (이미지=젠스파크로 생성)

미사일보다 먼저 멈추는 건 서버다…이란 전쟁, 중동 빅테크의 돈줄을 겨누다

중동은 한동안 빅테크의 차세대 성장지로 불렸다. 값싼 전력, 막대한 국부펀드 자금, 공격적인 국가 주도 투자, AI 인프라 수요가 한꺼번에 모인 곳이었기 때문이다. 그런데 이란 전쟁은 그 계산식의 앞자리를 바꾸고 있다.

[AI, 이제는 현장이다④] 모델보다 중요한 건 사람과 구조… AI 도입 성패는 조직 설계에서 갈린다

올해 기업들이 인공지능(AI)을 두고 마주한 가장 큰 질문은 기술보다 조직에 가깝다. 모델을 도입하는 일은 예전보다 쉬워졌지만, 그 모델을 어디에 붙이고 누가 무엇을 맡을지, 어떤 판단은 사람에게 남기고 어떤 업무는 AI에 넘길지는 여전히 어렵다. 생성형 AI 확산 초기에는 도구를 얼마나 빨리 들여왔는지가 경쟁력이었다면, 지금은 그 도구를 조직 안에서 어떻게 작동시키느냐가 더 중요한 단계로 들어섰다. 결국 올해 AI 도입의 성패는 더 좋은 모델을 확보했느냐보다, 사람과 역할, 승인과 책임, 학습과 평가의 구조를 얼마나 빨리 다시 설계하느냐에서 갈릴 가능성이 크다.

[현장] 국회서 쏟아진 ‘AX 보안’ 대응법… “AI 확산 속도만큼 보안·법제도 함께 가야”

토론회의 문제의식은 분명했다. AX 시대의 보안은 더 이상 시스템 한켠에 붙는 방어 기능이 아니라 산업 경쟁력과 사회적 신뢰를 지탱하는 핵심 인프라라는 점이다. AI 기술이 기업과 공공, 일상 서비스 전반으로 빠르게 스며드는 상황에서 보안이 뒤따라가는 구조로는 더 이상 대응이 어렵다는 현실 인식도 자리 잡고 있었다. 이날 국회에서 나온 논의는 결국 “AI를 전제로 한 사회에서 어떤 안전 체계를 먼저 갖출 것인가”라는 질문으로 모였다.