[Focus 마이데이터]① 데이터 인식의 전환, '수동적 동의'에서 '적극적 요구'로

[AI 요약] 개인이 생성하는 데이터는 전체 디지털 데이터 중 75%에 달한다. 이를 더 적극적으로 활용하기 위해 '본인신용정보관리업(이하 마이데이터)'다. 마이데이터는 지금까지의 개인정보가 포함된 데이터 활용 방식의 한계에서 비롯됐다. 마이데이터 방식이 떠오른 것은 "본인에 대한 데이터는 본인이 주인이며, 관리한다"는 인식 아래, 정보 주체인 개인으로 하여금 데이터 소유권에 대한 개념을 제공한다. 다시 말해 정보주체, 정보제공자, 정보수신자의 구분을 명확하게 함으로써 데이터 활용성을 극대화시킨다. 그래서 마이데이터에서는 개인정보의 '제공 동의'가 아니라, '전송 요구'라는 권리 개념이 쓰이게 된다.


올해 8월로 예정됐던 마이데이터 사업 시행이 2022년으로 연기된 가운데, 가장 빠르게 준비해오던 금융 업계부터 핀테크 등 관련 IT업계까지 분위기가 어수선해졌습니다. 이 시점에서 마이데이터의 의의와 핵심 개념, 프로세스를 알아보고, 또 이를 활용하기 위한 여러 기업의 비즈니스 모델을 살펴 봅니다. 수면으로 드러난 문제점을 점검하는 동시에 남은 기간 보완점은 무엇인지 분석합니다.

물과 같은 데이터, 어떻게 하면 마실 수 있을까?

지구는 70% 이상이 물로 채워져 있지만, 인류가 사용하는 물의 양은 채 1%도 되지 않는다. 쓸 수 없는 부분의 대부분을 차지하는 바닷물의 경우, 염분을 함유해 담수화 작업을 거치지 않으면 마실 수도 없고, 자원으로도 활용하기 힘들다. 존재하는 물에서 바닷물을 빼고 인간이 접근할 수 없는 땅 속 깊은 곳의 지하수 역시 제외하고 나면, 우리가 이용 가능한 물은 담수 중에서도 호수나 하천, 접근할 수 있는 지하수 등 0.39%에 불과하다. 데이터 역시 물과 같다. 우리 주위에 모든 것이 데이터임에도, 그동안 그 데이터는 존재하되 활용할 수 없는 채로 남겨져 있었다.

우리나라에서 데이터가 본격적으로 공개된 시점은 지난 2013년부터 행정안전부(당시 안전행정부)가 공공데이터 180종을 개방하기 시작한 이후 매년 생활안전, 재난안전, 사회안전('14), 보건식품안전(‘15), 시설안전(‘16), 산업안전 정보(‘17) 분야의 데이터를 공개했다.

데이터가 세상에 나오자, 그 활용도는 급격하게 증가했다. 공공데이터포털에 따르면, 개방 초기인 2016년 약 188만건의 공공데이터 활용 건수는 5년 만에 2085만건으로 약 1100% 증가했다.

출처: 공공데이터포털

마이데이터, 활용 가능한 데이터로 변화시키는 방법

공공데이터가 땅 깊은 곳의 지하수라면, 국민들이 보유한 데이터는 바닷물과 같다. 개인이 생성하는 데이터는 전체 디지털 데이터 중 75%에 달한다. 이를 조금 더 적극적으로 활용하기 위해 기반을 마련하자는 게 '본인신용정보관리업(이하 마이데이터)' 정책이다. 마이데이터는 그동안 바닷물처럼 마실 수 없었던 개개인의 데이터를 사회 전반에 걸쳐 활용 가능하도록 만들 거대한 담수화 작업이라 할 수 있다.

마이데이터가 주목 받게 된 계기는 지금까지의 개인정보가 포함된 데이터 활용 방식의 한계에서 비롯됐다. 개인정보를 활용하기 위해서는 가명처리를 해야한다. 가명처리된 개인정보는 '가명정보'가 되어 원래의 상태로 복원하기 위한 추가 정보의 사용 · 결합 없이는 특정 개인을 알아볼 수 없게 만들어진다.

그러나 가명처리의 수준을 높이면 가려지는 정보 역시 많아지기 때문에 그 활용 가치가 떨어지게 된다. 반대로 가명처리 수준을 낮추면 개인을 식별할 수 있는 가능성이 높아지기 때문에 개인 인권 침해 소지가 발생한다. 개인정보위원회는 개인정보는 개인에 관한 정보들이 모두 포함되어 있어 처리 활용하는 과정에서 개인의 사생활 침해 등 다양한 문제가 발생할 수 있다며, 개인정보 보호법 제28조의2(가명정보의 처리 등)에 따라 기술적 안전조치를 요구하고 있다.

구분설명예시
개인 속성 데이터
(Personal Attribute Data)
개인을 설명할 수 있는 데이터로
가장 일반적인 개인 데이터
이름, 생년월일, 성별, 주소, 학력, 직업 등
자발적 데이터
(Volunteered Data)
개인에 의해 생성되고
개인의 의지로 공유 가능한 데이터
전화번호, 사진, 이메일, 온라인 거래내역,
개인 블로그 및 SNS, 가입 신청 이력 등
관찰된 데이터
(Observed Data)
개인의 활동이 기록되어
수집 가능한 데이터
인터넷 접속 내역, CCTV, 위치 데이터 등
추론된 데이터
(Inferred Data)
개인 속성, 자발적, 관찰된 데이터 등을
분석해 도출한 데이터
개인신용평가점수, 구매 패턴 분석,
맞춤형 정보 제공을 위한 개인정보분석 등
개인정보의 종류
4차산업혁명위원회

이 때문에 마이데이터 방식이 떠오른 것이다. 마이데이터 방식은 '본인에 대한 데이터는 본인이 주인이며, 관리한다'는 인식 아래, 정보 주체인 개인으로 하여금 데이터 소유권에 대한 개념을 제공한다. 즉 정보주체, 정보제공자, 정보수신자의 구분을 명확하게 함으로써 데이터 활용성을 극대화시키는 것이다.

그래서 마이데이터에서는 개인정보의 '제공 동의'가 아니라, '전송 요구'라는 권리 개념이 쓰이게 된다. 전송 요구권이란 정보주체가 정보제공자로 하여금 본인이 원하는 서비스를 제공 받기 위하여 데이터의 전송을 요구하는 권리를 말한다.

예를 들어, 민수가 A은행에 천만원의 자산을 가지고 있다고 하자. 만약 B은행에서 자산 관리 서비스를 받고 싶다면, 민수는 A은행에 마이데이터 자료전송를 요구하는 것이다. 이에 대해 대통령직속4차산업혁명위원회는 정보주체(1)가 정보제공자(2)로 하여금 본인이 원하는 서비스를 제공받기 위해 정보수신자(3)에게 데이터의 전송을 요구하는 것으로 정의했다.

마이데이터 이전까지는 '제공 동의'에 의한 정보 제공이었기 때문에 어디에, 어떻게 쓰이는지도 알 수 없었던 '내 정보'를 이제 어떤 사업자에게, 어떻게 쓰이는지 확인할 수 있다.

이에 따라 정보주체는 단순히 동의 여부만 결정하는 것이 아니라 전송 정보와 목적, 전송을 하는 자, 전송받는 자, 전송주기, 전송종료 시점 등을 스스로 결정하여 요구할 수 있다.

금융위원회는 "전송 요구에 의한 정보 전송은 개인이 자신의 정보 전송 의지를 사업자가 실행하도록 요구하는 것"이라고 설명했다. 금융분야 마이데이터 사업에서 각 주체의 범위는 다음과 같다. 아래와 같이 은행이나 금융지주회사는 정보제공자이자, 정보수신자가 될 수 있다.

  • 정보제공자의 범위
  • 정보수신자의 범위

조회부터 전 분야 확산까지 마이데이터 활용성은 점점 커져

정부는 데이터 개방·활용 정도에 따라 마이데이터 사업 단계를 0 ~ 4단계로 구분하고 확산할 방침이다. 개인이 기기로 기관에 접속해서 정보를 열람하는 수준인 0단계부터, 개인의 정보가 자신의 관리 아래 전 분야에 걸쳐 활용될 4단계로 점점 데이터 활용성이 커질 예정이다.

0단계 - 조회스마트폰(또는 컴퓨터)으로 기관 홈페이지(또는 앱)에 접속해서 정보를 열람하는 수준
1단계 - 저장기관 홈페이지(또는 앱)에 접속해서 나에 관한 데이터를 내려 받아 저장하는 수준으로, 초기 단계
2단계 - 전송요구한 기관에서 다른 기관으로 내 데이터를 전송하도록 요구하고 이를 이행하는 단계(내보내기 또는 가져오기)
3단계 - 대리활용전송요구를 통해 내 데이터를 한 곳으로 모은 후, 이를 기반으로 맞춤형 서비스를 제공받는 단계(산업 내)
4단계 - 전 분야 확산본인의 적극적 관리․통제 하에 모든 분야 에서 내 데이터를 내 뜻대로 안전하고 편리하게 활용하는 단계
출처: 4차산업혁명위원회

이러한 데이터의 전송 요구 개념을 기반으로 한 마이데이터 방식은 이미 EU에서는 2018년 5월 법제화되어 시행 중이다. EU의 마이데이터의 명칭은 ‘본인계좌정보 관리업 (Account Information Service)’으로 불린다.

그 기반이 되는 EU의 GDPR(General Data Protection Regulation)은 온라인 서비스에 대한 정보주체의 선택권을 확대하고, 자료전송 요구권 등을 반영하는 등 마이데이터와 대전제를 공유한다고 볼 수 있다. 이는 동시에 자료 전송을 활성화시켜 거대 IT기업에 대한 개인 데이터에 대한 독점을 완화할 수 있다고 평가된다.

마이데이터는 디지털 뉴딜의 시작점이자 기반

더불어 마이데이터는 향후 디지털 경제 판도에서도 상당히 중요한 위치를 차지하고 있다. 오는 2025년까지 정부가 추산하는 데이터 시장 규모는 약 43조원, 이로부터 발생하는 일자리 90만 개다. 이에 대응해 D(데이터).N(네트워크).A(인공지능) 생태계 조성을 위해 디지털 뉴딜 정책을 펼치고 있다.

이를 위해 정부는 우선 데이터를 한 데 모으는 개념의 '데이터댐'을 구축한다. 데이터댐은 마이데이터 등 흩어져 있거나 새롭게 만들어지는 데이터를 담아내겠다는 디지털 뉴딜의 한 축으로, 데이터댐에 담길 데이터셋의 양은 약 14만 2000개 공공데이터, AI를 위한 학습용 데이터 1300종에 달한다.

정부는 마치 댐에 물을 가둬두고 필요한 때 흘려 보내듯 데이터를 모아두고 자율주행차, 스마트시티, 공공 AI 개발 등 데이터를 필요로 하는 산업에 공급할 방침이다. 이 데이터댐 구축을 위해 정부는 2022년까지 약 8조 5000억원을, 오는 2025년까지는 약 18조 1000억원의 예산을 투입할 예정이다. 관련 일자리 창출 예상치도 약 38만 9000개에 달한다.

하지만 만약 마이데이터가 제대로 모여지지 않는다면, 그 데이터를 담아낼 데이터댐 역시 빈 채 남게 된다. 즉 마이데이터는 데이터 관련 정책의 시작점으로, 향후 정책 성과를 판가름할 중요한 기준점이다.

석대건 기자

daegeon@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

음속으로 튜브를 달리는 ‘하이퍼루프’ 미래열차가 곧 출발합니다

우리 기업 포스코가 참여한 음속으로 튜브 속을 달리는 하이퍼루프 테스트 트랙이 네덜란드에서 개통됐다. 그동안 하이퍼루프는 ‘꿈의 기술’로 불리며 미래형 열차로 주목받았으나, 미국 기술의 실패로 좌절을 겪기도 했다. 그러나 유럽에서 가장 긴 하이퍼루프 테스트 트랙이 개통되면서 자기부상 기술과 진공관 운송 기술이 만난 ‘미래열차’의 실현이 가까워졌다.

[AI포럼] 이요한 서울대 보라매병원 교수 “수요자 입장에서 바라보는 의료 생성 AI의 조건”

‘Agile AI Forum(AI포럼)’의 마지막 3회차에서 특히 주목도가 높았던 것은 개발자 입장이 아닌 수요자 입장에서 의료에 적용되는 AI 기술의 방향성과 선결 과제를 언급한 이요한 서울대 보라매병원 정형외과 교수의 발표였다. KGIF(한국생성AI파운데이션) 부회장이기도 한 이 교수는 ‘생성AI와 Treatment algorithm’를 주제로 발표를 진행했다.

AI와 최상의 ‘맥주 맛’

과일 맛이 나는 램빅을 선호하든 복잡한 트라피스트 맥주를 선호하든 벨기에 맥주는 다양성, 품질 및 전통으로 오랫동안 유명해졌다. 이제 벨기에의 과학자들은 AI의 힘을 활용해 더 나은 맥주를 만들 수 있다고 제안한다.

[인터뷰] 김기현 트랜스파머 대표 “농업과 부동산, 금융을 결합한 AI 기반 농촌경제 디지털 전환 플랫폼을 만들고 있습니다”

온라인 부동산 서비스와 전문 앱이 관심을 두지 않는 농촌 부동산 정보의 디지털화는 과연 불가능한 것일까? 데이터, 경영 전문가인 김기현 대표의 고민은 그렇게 AI(인공지능) 기반 농촌경제 디지털 전환 플랫폼 ‘트랜스파머’ 개발로 이어졌다.