"'이루다'가 배운 카톡 대화 DB는 모두 증거"

[AI 요약] 사용자들의 일상 대화를 활용해 AI 대화 시스템을 구현하려는 시도는 불법의 영역에서 재판을 받게 되었다. 개발사가 이용자들에게 수집한 카카오톡 대화 내용을 제출하라고 명령하여, 데이터 수집 과정은 모두 증거로 인정되어, 임의로 파기할 수 없게 된 인공지능 기업의 데이터 활용 문제가 본격적인 법정 공방으로 돌입했다.


인공지능(AI) 기업의 데이터 활용 문제가 본격적인 법정 공방으로 돌입했다. 사용자들의 일상 대화를 활용해 AI 대화 시스템을 구현하려는 시도는, 이제 불법의 영역에서 재판을 받게 됐다. 이러한 AI 시스템 구축에 필요한 데이터를 모으는 과정은 앞으로 해당 산업 발전의 열쇠가 될 것으로 보인다.

지난 19일 법원은 AI 챗봇 이루다 개발사인 스캐터랩에 수집했던 카카오톡 대화 내용을 제출하라고 명령했다.

개발사가 이용자들에게 수집한 카카오톡 데이터베이스(DB)는 모두 증거로 인정돼, 이를 임의로 파기할 수 없게 된 것이다. 스캐터랩은 연애 정보 앱 '연애의 과학'을 통해 수집한 실제 연인 카톡 대화 1억 건을 AI 개발에 사용했다.

이 회사가 AI 챗봇을 개발하기 위해서 많은 DB가 필요했다. 그것도 실제 연인들이나 친구랑 이야기 했을 법한 대화체의 말을 모아야 했다. 사람처럼 자연스러운 언어를 구사하는 챗봇을 만들고, 머신러닝을 통해 스스로 학습해서 진화하는 AI를 만드는 것이 목표였기 때문이다.

이를 위해 스캐터랩은 이용자의 카카오톡 대화 100억건을 수집했다. 이 중에 많이 쓰이는 말투나 대화 1억건을 골라서 이루다의 DB에 적용했다.

이 탓에 이루다 출시 이후, 스캐터랩의 또다른 서비스 연애의 과학 사용자 300여 명은 스캐터랩을 상대로 개인정보 유출에 대한 집단 소송을 제기하고 증거 보전을 신청했다. 개인정보 유출 피해를 주장하며 100억건의 카카오톡 원본 DB와 1억건의 이루다 DB 모드 증거로 보전돼야 한다는 것이다.

이에 법원은 스캐터랩에 카카오톡 대화 DB와 이를 가공한 DB, AI가 학습을 통해 이뤄진 대화 내용 모두를 제출하라고 명령했다.

하정림 법무법인 태림 변호사는 "스캐터랩은 실명 등을 불완전 삭제했다. 또한 성적인 대화, 사상, 신념, 영업 비밀 등이 담긴 대화를 그대로 이루다 DB 학습 용도로 사용했고 이를 공개했다"면서, "확보한 DB로 위법 행위를 밝히고 소송을 진행할 것이다"라고 말했다.

서비스 초기 이루다 베타 테스트 모집 공고(출처: 스캐터랩) 
서비스 초기 이루다 베타 테스트 모집 공고(출처: 스캐터랩) 

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[현장] 국회서 쏟아진 ‘AX 보안’ 대응법… “AI 확산 속도만큼 보안·법제도 함께 가야”

토론회의 문제의식은 분명했다. AX 시대의 보안은 더 이상 시스템 한켠에 붙는 방어 기능이 아니라 산업 경쟁력과 사회적 신뢰를 지탱하는 핵심 인프라라는 점이다. AI 기술이 기업과 공공, 일상 서비스 전반으로 빠르게 스며드는 상황에서 보안이 뒤따라가는 구조로는 더 이상 대응이 어렵다는 현실 인식도 자리 잡고 있었다. 이날 국회에서 나온 논의는 결국 “AI를 전제로 한 사회에서 어떤 안전 체계를 먼저 갖출 것인가”라는 질문으로 모였다.

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...

[AI, 이제는 현장이다③] AI가 커질수록 공격도 빨라진다… 기업 보안이 다시 ‘기본기’로 돌아가야 하는 이유

AI를 말하면서 이제 보안을 따로 떼어놓기는 어렵다. AI가 기업 전반으로 퍼질수록 공격자도 같은 기술을 손에 넣고 있기 때문이다. 문제는 공격의 방향이 완전히 새로워졌다는 데 있지 않다. 오히려 익숙한 공격이 더 빨라지고, 더 값싸지고, 더 넓게 퍼질 수 있게 됐다는 점이 더 중요하다.