[Focus 마이데이터]① 데이터 인식의 전환, '수동적 동의'에서 '적극적 요구'로

[AI 요약] 개인이 생성하는 데이터는 전체 디지털 데이터 중 75%에 달한다. 이를 더 적극적으로 활용하기 위해 '본인신용정보관리업(이하 마이데이터)'다. 마이데이터는 지금까지의 개인정보가 포함된 데이터 활용 방식의 한계에서 비롯됐다. 마이데이터 방식이 떠오른 것은 "본인에 대한 데이터는 본인이 주인이며, 관리한다"는 인식 아래, 정보 주체인 개인으로 하여금 데이터 소유권에 대한 개념을 제공한다. 다시 말해 정보주체, 정보제공자, 정보수신자의 구분을 명확하게 함으로써 데이터 활용성을 극대화시킨다. 그래서 마이데이터에서는 개인정보의 '제공 동의'가 아니라, '전송 요구'라는 권리 개념이 쓰이게 된다.


올해 8월로 예정됐던 마이데이터 사업 시행이 2022년으로 연기된 가운데, 가장 빠르게 준비해오던 금융 업계부터 핀테크 등 관련 IT업계까지 분위기가 어수선해졌습니다. 이 시점에서 마이데이터의 의의와 핵심 개념, 프로세스를 알아보고, 또 이를 활용하기 위한 여러 기업의 비즈니스 모델을 살펴 봅니다. 수면으로 드러난 문제점을 점검하는 동시에 남은 기간 보완점은 무엇인지 분석합니다.

물과 같은 데이터, 어떻게 하면 마실 수 있을까?

지구는 70% 이상이 물로 채워져 있지만, 인류가 사용하는 물의 양은 채 1%도 되지 않는다. 쓸 수 없는 부분의 대부분을 차지하는 바닷물의 경우, 염분을 함유해 담수화 작업을 거치지 않으면 마실 수도 없고, 자원으로도 활용하기 힘들다. 존재하는 물에서 바닷물을 빼고 인간이 접근할 수 없는 땅 속 깊은 곳의 지하수 역시 제외하고 나면, 우리가 이용 가능한 물은 담수 중에서도 호수나 하천, 접근할 수 있는 지하수 등 0.39%에 불과하다. 데이터 역시 물과 같다. 우리 주위에 모든 것이 데이터임에도, 그동안 그 데이터는 존재하되 활용할 수 없는 채로 남겨져 있었다.

우리나라에서 데이터가 본격적으로 공개된 시점은 지난 2013년부터 행정안전부(당시 안전행정부)가 공공데이터 180종을 개방하기 시작한 이후 매년 생활안전, 재난안전, 사회안전('14), 보건식품안전(‘15), 시설안전(‘16), 산업안전 정보(‘17) 분야의 데이터를 공개했다.

데이터가 세상에 나오자, 그 활용도는 급격하게 증가했다. 공공데이터포털에 따르면, 개방 초기인 2016년 약 188만건의 공공데이터 활용 건수는 5년 만에 2085만건으로 약 1100% 증가했다.

출처: 공공데이터포털

마이데이터, 활용 가능한 데이터로 변화시키는 방법

공공데이터가 땅 깊은 곳의 지하수라면, 국민들이 보유한 데이터는 바닷물과 같다. 개인이 생성하는 데이터는 전체 디지털 데이터 중 75%에 달한다. 이를 조금 더 적극적으로 활용하기 위해 기반을 마련하자는 게 '본인신용정보관리업(이하 마이데이터)' 정책이다. 마이데이터는 그동안 바닷물처럼 마실 수 없었던 개개인의 데이터를 사회 전반에 걸쳐 활용 가능하도록 만들 거대한 담수화 작업이라 할 수 있다.

마이데이터가 주목 받게 된 계기는 지금까지의 개인정보가 포함된 데이터 활용 방식의 한계에서 비롯됐다. 개인정보를 활용하기 위해서는 가명처리를 해야한다. 가명처리된 개인정보는 '가명정보'가 되어 원래의 상태로 복원하기 위한 추가 정보의 사용 · 결합 없이는 특정 개인을 알아볼 수 없게 만들어진다.

그러나 가명처리의 수준을 높이면 가려지는 정보 역시 많아지기 때문에 그 활용 가치가 떨어지게 된다. 반대로 가명처리 수준을 낮추면 개인을 식별할 수 있는 가능성이 높아지기 때문에 개인 인권 침해 소지가 발생한다. 개인정보위원회는 개인정보는 개인에 관한 정보들이 모두 포함되어 있어 처리 활용하는 과정에서 개인의 사생활 침해 등 다양한 문제가 발생할 수 있다며, 개인정보 보호법 제28조의2(가명정보의 처리 등)에 따라 기술적 안전조치를 요구하고 있다.

구분설명예시
개인 속성 데이터
(Personal Attribute Data)
개인을 설명할 수 있는 데이터로
가장 일반적인 개인 데이터
이름, 생년월일, 성별, 주소, 학력, 직업 등
자발적 데이터
(Volunteered Data)
개인에 의해 생성되고
개인의 의지로 공유 가능한 데이터
전화번호, 사진, 이메일, 온라인 거래내역,
개인 블로그 및 SNS, 가입 신청 이력 등
관찰된 데이터
(Observed Data)
개인의 활동이 기록되어
수집 가능한 데이터
인터넷 접속 내역, CCTV, 위치 데이터 등
추론된 데이터
(Inferred Data)
개인 속성, 자발적, 관찰된 데이터 등을
분석해 도출한 데이터
개인신용평가점수, 구매 패턴 분석,
맞춤형 정보 제공을 위한 개인정보분석 등
개인정보의 종류
4차산업혁명위원회

이 때문에 마이데이터 방식이 떠오른 것이다. 마이데이터 방식은 '본인에 대한 데이터는 본인이 주인이며, 관리한다'는 인식 아래, 정보 주체인 개인으로 하여금 데이터 소유권에 대한 개념을 제공한다. 즉 정보주체, 정보제공자, 정보수신자의 구분을 명확하게 함으로써 데이터 활용성을 극대화시키는 것이다.

그래서 마이데이터에서는 개인정보의 '제공 동의'가 아니라, '전송 요구'라는 권리 개념이 쓰이게 된다. 전송 요구권이란 정보주체가 정보제공자로 하여금 본인이 원하는 서비스를 제공 받기 위하여 데이터의 전송을 요구하는 권리를 말한다.

예를 들어, 민수가 A은행에 천만원의 자산을 가지고 있다고 하자. 만약 B은행에서 자산 관리 서비스를 받고 싶다면, 민수는 A은행에 마이데이터 자료전송를 요구하는 것이다. 이에 대해 대통령직속4차산업혁명위원회는 정보주체(1)가 정보제공자(2)로 하여금 본인이 원하는 서비스를 제공받기 위해 정보수신자(3)에게 데이터의 전송을 요구하는 것으로 정의했다.

마이데이터 이전까지는 '제공 동의'에 의한 정보 제공이었기 때문에 어디에, 어떻게 쓰이는지도 알 수 없었던 '내 정보'를 이제 어떤 사업자에게, 어떻게 쓰이는지 확인할 수 있다.

이에 따라 정보주체는 단순히 동의 여부만 결정하는 것이 아니라 전송 정보와 목적, 전송을 하는 자, 전송받는 자, 전송주기, 전송종료 시점 등을 스스로 결정하여 요구할 수 있다.

금융위원회는 "전송 요구에 의한 정보 전송은 개인이 자신의 정보 전송 의지를 사업자가 실행하도록 요구하는 것"이라고 설명했다. 금융분야 마이데이터 사업에서 각 주체의 범위는 다음과 같다. 아래와 같이 은행이나 금융지주회사는 정보제공자이자, 정보수신자가 될 수 있다.

  • 정보제공자의 범위
  • 정보수신자의 범위

조회부터 전 분야 확산까지 마이데이터 활용성은 점점 커져

정부는 데이터 개방·활용 정도에 따라 마이데이터 사업 단계를 0 ~ 4단계로 구분하고 확산할 방침이다. 개인이 기기로 기관에 접속해서 정보를 열람하는 수준인 0단계부터, 개인의 정보가 자신의 관리 아래 전 분야에 걸쳐 활용될 4단계로 점점 데이터 활용성이 커질 예정이다.

0단계 - 조회스마트폰(또는 컴퓨터)으로 기관 홈페이지(또는 앱)에 접속해서 정보를 열람하는 수준
1단계 - 저장기관 홈페이지(또는 앱)에 접속해서 나에 관한 데이터를 내려 받아 저장하는 수준으로, 초기 단계
2단계 - 전송요구한 기관에서 다른 기관으로 내 데이터를 전송하도록 요구하고 이를 이행하는 단계(내보내기 또는 가져오기)
3단계 - 대리활용전송요구를 통해 내 데이터를 한 곳으로 모은 후, 이를 기반으로 맞춤형 서비스를 제공받는 단계(산업 내)
4단계 - 전 분야 확산본인의 적극적 관리․통제 하에 모든 분야 에서 내 데이터를 내 뜻대로 안전하고 편리하게 활용하는 단계
출처: 4차산업혁명위원회

이러한 데이터의 전송 요구 개념을 기반으로 한 마이데이터 방식은 이미 EU에서는 2018년 5월 법제화되어 시행 중이다. EU의 마이데이터의 명칭은 ‘본인계좌정보 관리업 (Account Information Service)’으로 불린다.

그 기반이 되는 EU의 GDPR(General Data Protection Regulation)은 온라인 서비스에 대한 정보주체의 선택권을 확대하고, 자료전송 요구권 등을 반영하는 등 마이데이터와 대전제를 공유한다고 볼 수 있다. 이는 동시에 자료 전송을 활성화시켜 거대 IT기업에 대한 개인 데이터에 대한 독점을 완화할 수 있다고 평가된다.

마이데이터는 디지털 뉴딜의 시작점이자 기반

더불어 마이데이터는 향후 디지털 경제 판도에서도 상당히 중요한 위치를 차지하고 있다. 오는 2025년까지 정부가 추산하는 데이터 시장 규모는 약 43조원, 이로부터 발생하는 일자리 90만 개다. 이에 대응해 D(데이터).N(네트워크).A(인공지능) 생태계 조성을 위해 디지털 뉴딜 정책을 펼치고 있다.

이를 위해 정부는 우선 데이터를 한 데 모으는 개념의 '데이터댐'을 구축한다. 데이터댐은 마이데이터 등 흩어져 있거나 새롭게 만들어지는 데이터를 담아내겠다는 디지털 뉴딜의 한 축으로, 데이터댐에 담길 데이터셋의 양은 약 14만 2000개 공공데이터, AI를 위한 학습용 데이터 1300종에 달한다.

정부는 마치 댐에 물을 가둬두고 필요한 때 흘려 보내듯 데이터를 모아두고 자율주행차, 스마트시티, 공공 AI 개발 등 데이터를 필요로 하는 산업에 공급할 방침이다. 이 데이터댐 구축을 위해 정부는 2022년까지 약 8조 5000억원을, 오는 2025년까지는 약 18조 1000억원의 예산을 투입할 예정이다. 관련 일자리 창출 예상치도 약 38만 9000개에 달한다.

하지만 만약 마이데이터가 제대로 모여지지 않는다면, 그 데이터를 담아낼 데이터댐 역시 빈 채 남게 된다. 즉 마이데이터는 데이터 관련 정책의 시작점으로, 향후 정책 성과를 판가름할 중요한 기준점이다.

석대건 기자

daegeon@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

AI로 ‘한 세대 한번’ 뿐인 기회를 잡은 ‘구글·유튜브’

구글이 지난해 법무부가 기소하면서 시작된 반독점 재판과 기업이 야심차게 출시한 새로운 AI 도구가 사실상 흥행 실패한 가운데, 알파벳은 사상최초로 배당금 700억달러 자사주를 매입했다는 소식을 알렸다. 다양한 악재 속에서도 알파벳은 적극적으로 생성형 AI 프로젝트에 리소스를 전환하면서 ‘한 세대 한번’ 뿐인 기회를 잡았다.

[생성형 AI 붐 시대①] 생성형 AI 산업 대폭발과 그 주변

AI 인덱스 보고서가 보여주는 AI 분야 경쟁 트렌드와 활용 및 과제 등을 포함하는 주목할 만한 15개 지표는 ▲생성형 AI투자 폭발 ▲폐쇄형 모델이 개방형 모델 성능 능가 ▲이미 매우 비싸진 파운데이션 모델 ▲미국이 파운데이션 모델 분야에서 선두 국가로 자리매김 ▲구글이 파운데이션 모델 경쟁 기업 가운데 독주 ▲AI 경쟁에 따른 무거운 탄소 발자국 발생 부작용 ▲AI 개발자들의 인종적 다양성, 일부 진전 ▲포춘 500 기업 조사결과 최소 1개 사업부가 AI 구현 ▲AI를 사용한 기업들의 비용 축소 및 매출 증가 ▲업계가 새로운 AI 박사 학위자들 채용 ▲기업들의 AI리스크 인식 ▲아직까지 인간을 능가하지 못한 AI ▲잇단 AI 책임 규범 개발 ▲법이 AI를 활성화하는 동시에 한편으로 제약 ▲사람들을 불안하게 만드는 AI로 요약된다.

야렉 쿠틸로브스키 딥엘 창업자 “사람과 상호작용하는 자체 LLM 기반 언어 AI 개발…번역, 글쓰기 이어 음성 번역 서비스도 선보일 것”

26일 딥엘의 창업자인 야렉 쿠틸로브스키 CEO가 직접 한국을 방문해 시장 진출 1년의 성과와 향후 전략을 발표했다. 쿠틸로브스키 CEO가 소개한 딥엘 라이트 프로는 딥엘의 자체 거대언어모델(LLM)로 구동되는 첫 서비스로, 기업이 사내외 커뮤니케이션, 계약서 등 기업이 글로벌 비즈니스 상황에서 더 명확하게 소통하는데 기여할 것으로 기대하고 있다.

자, 그럼 이제 ‘틱톡’은 누가 사게 되나요?

미국 의회가 틱톡을 미국에서 금지하는 법안을 통과시키고 하루만에 조 바이든 미국 대통령이 이에 서명함에따라, 설마했던 미국 틱톡 금지가 현실화 되고 있다. 이제 미국 정부와 업계는 틱톡의 새로운 주인을 찾기 위한 전략을 빠르게 세우고 있다.