챗지피티(chatGPT), 어디까지가 옳고 그름의 문제인가?

[AI요약] 챗지피티(ChatGPT)가 공개되자 인터넷과 SNS에서는 구글의 유일한 대항마가 될 수 있다는 환호성이 터져 나왔다. 검색과 대화는 기본이고 이메일 작성과 단순 업무 보고서 작성, 또한 프로그래밍 코드 작성 등 다양한 작업 결과가 공유됐다. 이는 곧 숫자로 증명됐다. 시범 서비스 개시 며칠 만에 이용자 수 100만을 넘어섰다.

챗지피티는 인공지능 연구재단 오픈에이아이(OpenAI)가 지난 12월 1일 공개한 초거대 인공지능(AI) 기반 챗봇으로 사용자가 대화창에 텍스트를 입력하면 그에 맞춰 대화를 함께 나누는 서비스이다.

개발사인 OpenAI는 ▲인공지능 언어모델 ‘지피티-3’(GPT-3) ▲그림을 그리는 인공지능 ‘달리2’(DALL-E2) ▲다국어 음성인식 인공지능 ‘위스퍼(Whisper)’ 등을 선보인 인공지능 연구 재단으로 잘 알려져 있다.

챗지피티는 방대한 데이터 처리 능력을 바탕으로 답변을 '자동 생성'한다. 이용자 질문이나 요청을 인식하고 단순히 사전에 입력된 데이터를 보여 주는 수준을 넘어 독자 콘텐츠를 만들어 내는데 특정 키워드나 조건을 충족하는 소설·시·에세이를 쓰는 것은 물론 복잡한 코딩 문제를 푸는 것도 가능하다.

챗지피티는 OpenAI에서 만든 대규모 언어 예측 모델인 ‘GPT-3.5’ 언어 기술을 기반으로 하는데, GPT는 어떤 텍스트가 주어졌을 때 다음 텍스트가 무엇인지까지 예측하며 글을 생성할 수 있는 모델이다. OpenAI에서는 2018년 GPT-1 출시 이후 2019년 GPT-2, 2020년 GPT-3에 이르기까지 버전을 높이며 발전을 거듭해 왔다.

특히, AI 언어모델 '지피티3'(GPT-3)를 발전시킨 지피티3.5로 언어를 학습, 인간과 자연스러운 대화를 나누고 질문에 대한 답을 내놓는다.

GPT-3에서 GPT는 Generative Pre-trained Transformer(생성적 사전학습 트랜스포머)의 줄임 말로 방대한 양의 데이터셋(3천억 개의 토큰)과 매개변수(파라미터) 1,750억 개를 갖춘 자연어 모델 기반의 딥러닝 시스템이다. 단일 문장 수준으로만 파악이 가능했던 기존 인공지능과 서비스와 달리 대화의 문맥을 파악하고 창의적인 답변을 내놓을 수 있는 수준을 갖고 있다. 이는 사람의 피드백을 활용한 강화학습(Reinforcement Learning)을 통해 대화의 주제와 지식정보 전달은 물론 창의적 아이디어에 대한 답변 및 기술적 문제의 해결 방안 제시 등 그 범위가 매우 광범위하다.

왜 유저들은 구글의 대항마라고 말할까?

챗지피티가 구글과 다른 결정적인 부분은 서술형으로 질문해도 인공지능이 정답을 찾아준다는 점이다. 다만, 정답의 관점은 사용자의 시각에 따라 또한 사용자의 정의에 따라 달라질 수 있다.

사용자가 심심해서 묻는 의미 없는 질문에 챗지피티의 답변은 사용자의 의도에 맞춤형으로 답변이 나온다는 점에서는 '정답'이라고 볼 수 있다. 또한, 각 나라의 날씨나 인구수 등 유동적일 수 있는 답변은 미리 유동적일 수 있다는 문장의 시작으로 사용자가 찾을 수 있는 '차선'의 선택을 도와준다.

챗지피티의 사용자 질의 검색 결과 (사진=테크42)

즉, 기존의 구글에서는 원하는 답변을 얻기 위해 직접 조각의 키워드를 입력 후 서칭했다면 챗지피티는 사람과 대화하듯이 서술적인 포괄적 검색을 해도 챗봇이 그에 따른 결과를 도출에 낸다는 것이다. 이는 같은 결과를 원하는 사용자 별로 각기 다른 입력 키워드에 따라 취합된 자료의 퀄리티가 천차만별로 달라지는 것이다. 한때 우리는 '인터넷 검색사'라는 자격증을 '국가 공인' 시험으로 시행한 적이 있었다.

다만, 방대한 양의 학습에도 불구하고 사용자가 원하지 않는 결과가 도출될 수도 있다. 서술형의 답변으로 신선한 결과를 만들어 낼 수 있지만 사용자가 원하는 정확한 결과는 아니라는 점이다. 이는 기존 구글과 네이버와 같은 검색엔진이 가지고 있는 장점과는 별개되는 것이다.

이에 개발자들의 질의응답 사이트인 ‘스택오버플로’는 챗지피티를 통해 생성한 답변을 등록하는 걸 당분간 금지했다. 오답률이 높고 일반적으로 그럴듯해 보이지만 수준이 높지 않은 경우가 많기 때문이다.

챗지피티의 사용자 질의 검색 결과 (사진=테크42)

또한, 일반적인 OpenAI는 챗봇의 차별·혐오 발언을 차단하기 위해 AI 기반 조정 시스템인 ‘모더레이션API’(Moderation API)를 사용했다. 이에 챗지피티는 허용되지 않는 내용의 질문이 나올 경우 ‘차별적· 공격적이거나 부적절한 질문, 여기에는 인종차별적, 성차별적, 동성애 혐오적, 성전환자 혐오적 또는 기타 차별적이거나 혐오스러운 질문이 포함됩니다’라고 답변한다. 챗지피티는 가끔 잘못되거나 편향적인 정보를 제공할 수 있으며, 2021년 이후의 지식은 제한돼 있다는 한계도 있다.

하지만 한계는 또 다른 도전을 낳는다. 암산과 암기로 풀이하던 수학을 지금은 계산기로 두들긴다. 하지만, 계산기로 수학 시험을 보지는 않는다. 인간이 정한 테두리 안에서의 '위법'이기 때문이다. 지금 당장 챗지피티와 대화를 한다면 24시간이 모자를 수도 있다. 그 24시간 안에 위법과 금지를 만드는 건 인간이 도전해야 할 또 다른 일이다. 24시간의 시간을 위해 또 다른 24시간이 필요한 이유이다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

클레이튼 핀시아 통합 체인 신규 브랜딩 ‘카이아(kaia)’ 공개, 탈중앙화금융 강화 통해 아시아 1위 메인넷 로드맵 소개

토종 글로벌 레이어 1 블록체인 플랫폼 클레이튼(Klaytn)과 핀시아(Finschia)의 통합 블록체인 추진 협의체 ‘프로젝트 드래곤(Project Dragon)’이 30일 신규 브랜딩 ‘카이아(kaia)’를 공개했다.

[생성형 AI 붐 시대②] 양날의 검 AI···활용 성과 및 리스크

AI 활용의 효율성 속에서도 아직 주 사용자인 기업들에게는 해결해야 할 과제가 있다. 기업은 AI를 활용하면서 성과를 보이고 있지만 동시에 리스크를 인식하고 있고 불안해 하고 있다. 페이크AI의 부작용 같은 것이 그것이다. 이에 각국 정부가 AI책임 규범을 만들고 있다.

AI로 ‘한 세대 한번’ 뿐인 기회를 잡은 ‘구글·유튜브’

구글이 지난해 법무부가 기소하면서 시작된 반독점 재판과 기업이 야심차게 출시한 새로운 AI 도구가 사실상 흥행 실패한 가운데, 알파벳은 사상최초로 배당금 700억달러 자사주를 매입했다는 소식을 알렸다. 다양한 악재 속에서도 알파벳은 적극적으로 생성형 AI 프로젝트에 리소스를 전환하면서 ‘한 세대 한번’ 뿐인 기회를 잡았다.

[생성형 AI 붐 시대①] 생성형 AI 산업 대폭발과 그 주변

AI 인덱스 보고서가 보여주는 AI 분야 경쟁 트렌드와 활용 및 과제 등을 포함하는 주목할 만한 15개 지표는 ▲생성형 AI투자 폭발 ▲폐쇄형 모델이 개방형 모델 성능 능가 ▲이미 매우 비싸진 파운데이션 모델 ▲미국이 파운데이션 모델 분야에서 선두 국가로 자리매김 ▲구글이 파운데이션 모델 경쟁 기업 가운데 독주 ▲AI 경쟁에 따른 무거운 탄소 발자국 발생 부작용 ▲AI 개발자들의 인종적 다양성, 일부 진전 ▲포춘 500 기업 조사결과 최소 1개 사업부가 AI 구현 ▲AI를 사용한 기업들의 비용 축소 및 매출 증가 ▲업계가 새로운 AI 박사 학위자들 채용 ▲기업들의 AI리스크 인식 ▲아직까지 인간을 능가하지 못한 AI ▲잇단 AI 책임 규범 개발 ▲법이 AI를 활성화하는 동시에 한편으로 제약 ▲사람들을 불안하게 만드는 AI로 요약된다.