오답노트부터 인연 추천까지...AI 협력적 필터링으로 푼다

우리의 뇌가 하나의 방법으로만 공부하지 않듯 인공지능(AI) 역시 여러 가지 학습법을 가지고 있다.

그중 널리 활용되는 분야인 사용자의 취향이나 패턴을 학습하는 AI의 경우 협력적 필터링으로 학습한다.

말 그대로 여러 데이터를 한 번에 취합한 결과를 필터링해서 선택 가능한 범위를 줄이는 방법이다.

 

사용자를 알아야 추천도 할 수 있다

협력적 필터링의 전제는 둘로 구분할 수 있다.

  • 첫째, 어딘가에 자신과 유사한 선택을 한 사람이 있다.
  • 둘째, 범위가 넓고 필터링이 구체적일수록 미래 예측은 예리해진다.

나와 비슷한 다수의 사용자가 선택한 좋고 나쁨의 결과가 추천 리스트에 영향을 준다는 의미다.

이러한 대표적인 협력적 필터링 사례로는 넷플릭스와 유튜브와 같은 콘텐츠 추천 시스템이 있다.

다만, 추천이 어긋나는 이유는 사용자에 대한 데이터가 부족하기 때문.

다른 사용자의 데이터만 많다고 해서 추천이 고도화될 수 없는 이유다.

이러한 벽을 넘기 위해 콘텐츠 제공 서비스 기업은 일정 기간의 프로모션을 통해 사용자를 묶어두고자 한다.

 

(출처: 유튜브 오리지널)
(출처: 유튜브 오리지널)

 

저 사람이 틀린 문제, 나도 틀렸다면?

즉, 사용자 데이터를 확보해야만 사용자 개인화가 가능해진다.

이러한 협력적 필터링 기법은 영상이나 글 등 콘텐츠를 넘어 활용할 수 있다.

대표적인 사례가 토익 문제에 협력적 필터링을 적용한 뤼이드의 산타토익이 있다.

산타토익은 수험생이 계속 틀리는 문제를 추천 콘텐츠로 지정했다.

AI가 오답 노트를 작성해주는 것. 그 오답 노트는 나와 유사한 학습 수준과 유형을 가진 이들과 함께 만들어진다.

그리고 빠르게 원하는 토익 점수를 달성케 하는 방법이다.

예를 들어, 아래와 같이 미애, A, B, C, D의 5명의 수험자가 있다고 하자.

그리고 A~D는 이미 6번까지의 문제를 풀었다.

각각 채점 결과 느리게 풀고 문제도 틀린 1부터 빠르게 풀고 문제도 맞힌 5까지 결과도 역시 나왔다.

결과를 비교하니, 미애와 B는 유사한 문제 풀이 형태를 보였다.

이 경우, 미애에게 아이템5 문제를 준다고 해도 잘 맞출 것이고, 아이템 6 문제를 틀릴 가능성이 높다.

 

산타토익은 틀릴 문제만 골라줌으로써 빠른 점수 획득이 관건인 수험생의 시간까지 절약하는 셈.

수험생이 한 회 모의고사 분량인 LC 100문제, RC 100문제만 풀어도, 넷플릭스의 관점에서 보면 200편의 영상을 시청한 셈이다.

이는 수험생 개인화로 이어진다.

같은 서비스를 이용하지만 다른 콘텐츠를 제공 받듯, 산타토익 역시 다른 문제를 제공 받는다. 

이러한 사용자 중심 서비스는 이미 한국과 일본의 교육 앱부문 매출 1위를 달성으로 증명됐으며, 2017년 출시 이후 200만명 이상의 누적 사용자를 보유하고 있다.

 

"단순한 세대 차이가 아니다"

협력적 필터링 기법은 향후 서비스 시장에서 더욱 활용될 것으로 예상된다.

특히 사람을 매개로 비즈니스 되는 결혼정보회사, 소개팅 애플리케이션, 취향 기반 서비스 등에서 

시장분석기업 앱엔이프에 따르면, 2020년 말 국내 온라인 데이팅 서비스 사용자는 1년 만에 약 55%가 증가했다.

애플리케이션 매출 순위권 역시 게임을 제외하면 데이팅 앱이 차지하고 있다.

직장인 커뮤니티 블라인드도 직장인 전용 데이팅 서비스인 '블릿'을 출시한 바 있다.

애플리케이션 내 매칭 역시 넷플릭스와 산타토익과 같은 협력적 필터링을 통해 이뤄진다.

소개팅 서비스 운영사 관계자는 "단순히 시대의 변화라기보다는 이전에 중매의 판단에만 의존했던 서비스가 AI와 데이터를 통해 개선되는 것"이라고 전했다.

 

 

 

석대건 기자

daegeon@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[현장] 전력·냉각·보안부터 로봇·바이오까지… KAIST 딥테크 스타트업이 제시한 AI 시대 생존 전략

KAIST 창업원이 주최·주관한 ‘KAIST Startup Scaleup Summit 2026’이 지난 18일 서울 코엑스 3층 컨퍼런스홀 E5·E6에서 열렸다. 넥스트라이즈 2026 서울(NextRise 2026, Seoul) 파트너 행사로 마련된 이 행사는 KAIST 스타트업 성장 공동체를 기반으로 투자사와 창업자, 기술 인재가 만나는 스케일업의 장을 표방했다.

"2000조원 메가 프로젝트, 왜 환호 대신 의구심이 먼저인가"

숫자가 모든 것을 말하지는 않는다. 6월 29일 청와대 영빈관에서 공개된 '대한민국 대도약 3대 메가프로젝트'의 청사진은 분명 압도적이었다.

GPT-5.6은 제한 공개, 제미나이는 사용 제한…AI 경쟁은 ‘접근권 전쟁’으로 바뀌었다

생성형 AI 주도권 경쟁의 상황이 급변하고 있다. 최근까지 시장의 관심은 누가 더 강력한 모델을 먼저 공개하느냐에 집중됐다. 그러나 최근 오픈AI(OpenAI), 앤트로픽(Anthropic), 구글(Google), 메타(Meta)를 둘러싼 변화는 양상이 다르다. 이제 중요한 것은 모델 성능만이 아니다. 누가 최상위 모델에 접근할 수 있는지, 어느 기업이 충분한 컴퓨트(compute)를 배정받을 수 있는지, 또 어떤 조직이 정부와 플랫폼 기업이 요구하는 신뢰 기준을 충족할 수 있는지가 AI 경쟁의 핵심 변수로 떠오르고 있다.

[현장] AI가 뉴스를 요약하는 시대, 저널리즘은 무엇으로 살아남나

17일 진행된 ‘AI와 언론(AI & Journalism)’ 세션에서는 뉴스룸과 저널리즘이 AI 시대에 어떤 방식으로 재편되고 있는지가 집중적으로 논의됐다. 먼저 이상덕 매일경제신문 기자가 ‘AI 에이전트 시대 뉴스룸의 생존법: 초압축 시대와 브랜드 어피니티’를 주제로 발제했고, 이어 이은주 서울대학교 교수 겸 CTAI 센터장이 좌장을 맡아 강정수 블루닷에이아이 연구센터장, 이나연 연세대학교 교수, 박아란 고려대학교 교수와 함께 ‘뉴스룸의 전환: AI 시대와 저널리즘의 미래’를 주제로 패널토론을 진행했다.