어떻게 스포티파이는 내 마음을 쏙 알아낼까?

결론부터 말하면, 결국 AI다. 

스포티파이는 'BaRT(Bandits for Recommendations as Treatments)를 사용자 데이터 적용하고, 이 결과값을 제공한다.

'BaRT'은 원리는 '멀티 암드 밴딧 알고리즘(MAB)'에서 비롯되는데, 이게 스포티파이 머신러닝의 기초가 된다.

음악 추천은 슬롯머신과 같다

100만원 카지노에 갔다고 하자. 슬롯머신이 3개 있다. 당연히 나는 돈을 잃고 싶지 않다. 

그래서 우선 1만원씩 넣고 돌려본다. 그랬더니 3만원, 0원, 5천원이 나왔다.

이제 첫번째 슬롯머신에 돈을 모두 넣어야 할까? 

아니다. 랜덤이니 그랬다가는 돈은 하향곡선을 그리게 될 것.

확률적으로 보면 각 슬롯머신에서 돈을 딸 확률은 50%이다. 

이제 경험적으로, 첫 번째 슬롯머신으로 수익이 있었으니 베팅할 근거가 생겼다. 

아직까지 수익을 올릴 수 있는 최적의 슬롯머신은 첫 번째 슬롯머신이다.

만약 다음 베팅에서 첫 번째 슬롯머신이 돈을 잃었다면?

다시 초기 랜덤 선택으로 돌아와 베팅을 한다. 

녹색은 첫번째 슬롯머신으로만 베팅한 결과로, 보상값이 가장 낮다(출처: Reinforcement Learning)
녹색은 첫번째 슬롯머신으로만 베팅한 결과로, 보상값이 가장 적다(출처: Reinforcement Learning)

이렇게 최적을 찾아가는 알고리즘, 즉 탐색(Exploration)한 후, 활용(Exploitation)하고 다시 탐색하는 방식이 MAB의 기초라고 할 수 있다.

스포티파이의 선곡은 슬롯머신에 베팅하는 것과 같다.

만약 사용자가 스포티파이의 추천 음악을 들었다면, 스포티파이는 돈을 딴 셈이다.

그렇다면 사용자가 정말 추천 음악을 좋아하는지는 어떻게 알 수 있을까?

 

인내심의 한계는 30초까지

비밀은 '30초'에 있다.

스포티파이 프로덕트 디렉터였던 매튜 오글은 "30초 전을 건너뛰는 것은 플레이리스트의 엄지손가락 아래로 내리는 것과 같다"고 말했다. 

30초 만에 사람이 노래를 좋아하는지, 싫어하는지를 판단할 수 있다는 것이다.

여기에 음악 듣기 기록, 건너뛴 노래, 나와 유사한 노래를 들었던 사람들의 음악 선호도 데이터까지 더해진다.

또 스포티파이는 다양한 추천 재생목록을 통해 사용자에게 자신들의 추천을 설명하고 제안한다. 

이 역시도 일정 시간 이상 듣게 되면, 해당 목록이 가진 관련 데이터 역시 취향에 반영된다.

(출처: 스포티파이)

이외에도 음악 관련 블로그의 설명 분석, 위치에 따른 재생 목록, 기간에 따른 특정 아티스트 반복 재생 등도 데이터로 만들어 AI에 학습시켰다.

스포티파이는 2016. 12 ~ 2018. 2까지 약 1,600만 명의 사용자 데이터를 연구했다고 밝히기도 했다.

즉, 사용자가 30대라면, 우리나라 30, 40대 인구가 더한 인구가 약 1,500만 명이니, 이중에서 비슷한 음악 취향을 가진 사람에게 물어 보고 음악을 추천해준 것과 같다.

더불어 성별에 따라, 연령의 변화에 따라 음악에 대한 반응까지도 스포티파이는 데이터로 바꾸고 있다.

이렇게 점점 나의 취향과 관련 데이터는 엄청나게 많아지고, 스포티파이는 점점 더 좋은 음악 추천을 해줄 수 있다.

그 말은, 돈을 딸 수 있는 슬롯머신을 이전보다 더 잘 고를 수 있다는 뜻이다.

 

AI만이 유일한 방법

이미 스포티파이의 세계 음원 시장의 30%를 차지하고 있다.

사용자 수는 약 3억 2천만 명이고, 유료 사용자는 약 1억 4천만 명을 상회한다.

무료 사용자는 랜덤 재생 기능만 쓸 수 있는데, 이는 취향 데이터 수집에도 용이하다.

랜덤 재생해주는 서비스가 자신이 좋아하는 곡을 골라 틀어준다면, 무료 사용자라도 당연히 프리미엄으로 사용하고 싶을 수밖에 없다.

모든 사용자는 자신을 제대로 알아봐 주는 서비스를 원하니까.

이것이 스포티파이가 데이터를 이용한 AI 알고리즘만이 유일한 방법이라고 고집하는 이유다.

 

 

석대건 기자

daegeon@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[현장] 국회서 쏟아진 ‘AX 보안’ 대응법… “AI 확산 속도만큼 보안·법제도 함께 가야”

토론회의 문제의식은 분명했다. AX 시대의 보안은 더 이상 시스템 한켠에 붙는 방어 기능이 아니라 산업 경쟁력과 사회적 신뢰를 지탱하는 핵심 인프라라는 점이다. AI 기술이 기업과 공공, 일상 서비스 전반으로 빠르게 스며드는 상황에서 보안이 뒤따라가는 구조로는 더 이상 대응이 어렵다는 현실 인식도 자리 잡고 있었다. 이날 국회에서 나온 논의는 결국 “AI를 전제로 한 사회에서 어떤 안전 체계를 먼저 갖출 것인가”라는 질문으로 모였다.

‘링크의 시대’에서 ‘답변의 시대’로…구글 ‘서치 라이브’가 바꾸는 검색의 질서

서치 라이브는 검색 결과를 읽는 경험보다, 검색과 ‘대화하는’ 경험에 가깝다. 사용자는 구글 앱 안에서 음성으로 질문을 이어가고, 필요하면 카메라로 사물을 비추며 실시간 도움을 받을 수 있다. 이는 검색이 단발성 쿼리에서 벗어나 문맥을 유지하는 세션형 인터페이스로 이동하고 있음을 보여준다.

‘AI’를 향한 아마존의 거대한 ‘20년 승부수’

[AI요약] 20년전 생소한 개념의 클라우드 컴퓨팅 서비스인 AWS를 출시한 후, 해당 서비스를 인터넷 기반 도구에 의존하는 거의 모든 기업에게 필수불가결한...

[AI, 이제는 현장이다③] AI가 커질수록 공격도 빨라진다… 기업 보안이 다시 ‘기본기’로 돌아가야 하는 이유

AI를 말하면서 이제 보안을 따로 떼어놓기는 어렵다. AI가 기업 전반으로 퍼질수록 공격자도 같은 기술을 손에 넣고 있기 때문이다. 문제는 공격의 방향이 완전히 새로워졌다는 데 있지 않다. 오히려 익숙한 공격이 더 빨라지고, 더 값싸지고, 더 넓게 퍼질 수 있게 됐다는 점이 더 중요하다.