당신의 데이터 시각화가 잘못된 4가지 이유

“데이터 시각화(Data Visualization)를 활용하면 데이터 분석 결과를 쉽게 파악할 수 있다”는 이야기는 많이 들어보셨죠? 데이터의 종류와 양이 방대해지면서 실무에서도 데이터 분석 결과를 효율적으로 공유할 수 있는 데이터 시각화를 자주 사용하는데요, 데이터 시각화뿐만 아니라 데이터 시각화 여러 개를 종합해서 인사이트를 도출하는 데이터 시각화 대시보드도 많이 사용하고 있습니다. 

여러분이 만든 데이터 시각화와 대시보드는 실무에 얼마나 도움이 되나요? 혹시 데이터 시각화를 만드는 그 자체만 중요하게 생각하고 있지는 않나요?

이번 글에서는 데이터 시각화와 데이터 시각화 대시보드를 효과적으로 제작, 활용하고 있는지를 확인할 수 있는 4가지 체크 포인트를 이야기하고자 합니다. 그동안 데이터 시각화와 대시보드를 제작하면서 혹시 놓친 부분은 없는지, 앞으로 중요하게 고려해야 할 것들은 무엇인지 확인해 보세요!

1. 적합한 데이터 시각화 유형(차트)을 선택했나요?

가장 먼저 확인해야 할 것은 적합한 데이터 시각화 유형을 선택했는지입니다. 데이터의 종류에 따라 사용하는 시각화 유형도 달라져야 하는데요! 항목끼리 비교할 때, 분포를 보고 싶을 때, 흐름을 나타낼 때 등 목적에 따라 적합한 유형을 사용해야 데이터의 의미를 효과적으로 전달할 수 있습니다. 

예를 들어볼게요. ‘약 75가지 항목을 비교하는 데이터 시각화 차트’를 제작하려고 합니다. 어떤 차트를 사용하는 것이 효과적일까요? “파이 차트(Pie Chart)가 마음에 드니까 파이 차트를 써볼까?”라고 선택하면 어떻게 될까요?

아래쪽에 보이는 데이터 시각화 차트가 ‘약 75가지 이모티콘을 비교한 파이 차트’ 인데요, 2019년을 기준 이모티콘별 사용 빈도를 비중으로 나타내고 있습니다.  

△ 2019년 가장 자주 사용된 이모티콘의 빈도를 나타낸 파이 차트 (출처: UNICODE)

이 파이 차트를 보니 어떤가요? 해당 차트는 약 75개의 이모티콘 데이터를 담고 있는데 반복된 컬러를 사용하고 레이블도 드문드문 붙어 있어 정확한 정보를 파악하기 어렵습니다. 

파이 차트는 조각의 크기를 비교해서 데이터의 크기를 확인하는 유형으로 항목이 5개 이하일 때 데이터의 의미를 가장 효과적으로 전달할 수 있습니다. 

우리가 ‘2019년 사용한 이모티콘’ 데이터에서 알고 싶은 것은 전체 75개 이모티콘의 순위를 줄 세우는 형태는 아닐 것입니다. ‘어떤 이모티콘이 많이 사용됐는지’가 더 궁금하지 않을까요? 때문에 해당 데이터는 상위 20개 정도만 추려서 막대차트나 영역차트, 트리맵 차트 등 다른 유형으로 시각화했다면 데이터의 의미를 쉽게 파악할 수 있지 않았을까 하는 생각이 듭니다. 

데이터를 시각화할 때는 목적에 따라 적합한 데이터 시각화 유형을 선택하고, 데이터의 의미를 효과적으로 나타낼 방법이 무엇인지 고려해야 합니다. 데이터를 시각화하는 이유가 데이터의 의미를 쉽게 전달하기 위함이니까요! 필요한 데이터를 추리거나 여러 개의 차트를 가지고 구성하는 등 다양한 방법을 사용할 수 있습니다. 

2. 데이터 시각화의 가독성을 고려했나요?

두 번째는 데이터 시각화의 가독성을 고려했는지를 생각하는 건데요, 데이터의 의미를 직관적으로 전달하기 위해 데이터 시각화를 활용하는 만큼 ‘얼마나 쉽게 읽히는지’도 중요한 요소입니다. 

△미국의 1만 명당 강력범죄와 재산범죄를 나타낸 버블 차트(출처: Polymer)

위쪽에 보이는 데이터 시각화는 미국의 각 주(State)에서 강력범죄와 재산범죄가 얼마나 일어나는지를 보여주는 버블차트(Bubble Chart)입니다. y축은 1만 명당 강력범죄를, x축은 1만 명당 재산범죄의 비율을 나타내고 있습니다.

버블 차트는 원의 크기를 기준으로 데이터의 크기를 비교하는 데이터 시각화 유형인데요, 원의 크기가 클수록 1만 명당 범죄 비율이 높은 주임을 알 수 있습니다. 하지만, 해당 데이터 시각화는 항목이 많아 버블이 겹쳐 있고 원의 크기가 비슷해서 어느 주의 범죄 비율이 높은지를 직관적으로 판단하기 어렵습니다. 

기준을 가지고 항목을 나눠서 여러 개의 데이터 시각화를 만들거나 필터를 넣어 정보를 빠르게 파악할 수 있도록 구성하는 것이 좋습니다. 

하나의 시각화에 너무 많은 정보를 포함하면 데이터 시각화의 의미를 잃을 수도 있는데요! 데이터 시각화의 목적이 데이터의 의미를 쉽게 전달하는 것인 만큼 시각화의 가독성을 고려해서 너무 많은 정보를 담지 않도록 해야 합니다. 

3. 목적에 따라 데이터 시각화 대시보드를 설계했나요?

데이터 시각화 차트 하나만 보는 것보다 관련된 여러 데이터 시각화를 함께 보는 것이 더 많은 인사이트를 도출할 수 있겠죠! 그래서 한 개 이상의 데이터 시각화 차트를 한 화면에 배치해서 데이터를 탐색할 수 있도록 ‘설계’한 데이터 시각화 대시보드를 활용하는데요.

△ 하나의 화면에 여러 데이터를 담은 대시보드 사례(출처: Medium_Taras Bakusevych)

하나의 화면(대시보드)에 데이터 시각화가 너무 많이 들어가면 어떻게 될까요? 위의 데이터 시각화 대시보드를 보면 상품(Products), 사용자(Users), 지역(Regions), 새로운 사용자(New Users), 페이지 뷰(Page views) 2개, 활동(Activity), 예산(Budget), 소득(Income)까지 하나의 화면에 총 9개의 데이터 시각화가 있습니다. 여기서 어떤 데이터가 중요한지 빠르게 확인할 수 있을까요? 들어가 있는 데이터 항목도 제각각이라 어떤 내용을 전달하려는 대시보드인지도 불명확합니다. 

사람의 뇌는 한계가 있어서 동시에 여러 가지의 일을 처리하기 어려운데요, 하나의 대시보드에는 목적에 맞게 일관성 있는 데이터 시각화 5~7개 정도를 배치하는 것이 좋습니다. 데이터가 너무 많으면 사용자가 이해하기 힘들고, 대시보드의 목적이 다양하다면 그에 맞춰 각각의 대시보드를 만드는 것이 더욱 효과적입니다. 

목적에 맞는 데이터 시각화 대시보드를 제작할 때 중요한 개념이 바로 ‘설계’입니다. 여러 데이터 시각화 차트를 단순히 나열하는 것이 아니라 목적에 맞게 데이터의 인사이트를 얻을 수 있도록 구조적으로 설계되어야 합니다. 

데이터 시각화 기획자 테일러 브라운로우(Taylor Brownlow) 이야기는 뚜렷한 목적 없이 제작한 데이터 시각화 대시보드의 한계를 잘 보여줍니다.

“데이터 시각화 대시보드 하나를 배포하면 새로운 뷰, 필터, 영역, 페이지 등을 보여달라는 요청이 이어졌습니다. 67페이지짜리 대시보드를 본 적도 있어요. 대시보드를 통해 의미 있는 인사이트를 제대로 제공하지 못한 것이죠. 사람들이 필요로 하는 답을 주는 방식이 잘못됐거나, 대시보드 설계 단계의 실패라고 생각해요. 심지어는 필터를 사용해서 데이터를 내보내고 이걸 다시 엑셀로 가공해서 사용하더라고요”

 테일러 브라운로우(Taylor Brownlow)

뉴스젤리는 데이터 시각화 대시보드를 제작할 때 반드시 사용자 인터뷰를 진행하는데요, 이를 통해 이 데이터 시각화 대시보드의 목적은 무엇인지, 이를 통해 사용자가 무엇을 알고 싶어 하는지 등을 면밀히 분석해서 대시보드를 제작합니다. 여러분도 데이터 시각화와 대시보드를 제작하기에 앞서 목적이 무엇인지를 심도 깊게 고민하는 습관을 지녀보세요!

4. 데이터 시각화 대시보드에서 중요한 정보를 한눈에 파악할 수 있나요?

마지막은 대시보드의 디자인과 관계가 있는데요, 중요한 데이터와 덜 중요한 데이터를 구분하였는가를 생각해야 합니다. ‘전자상거래 – 흔히 발생하는 실수(E Commerce – Common Mistakes)’라는 제목의 아래쪽 데이터 시각화 대시보드는 왼쪽부터 전체 판매 금액, 영국 판매 금액, 미국 판매 금액 데이터를 보여줍니다.

△ 전자상거래에 관한 데이터 시각화를 보여주는 데이터 시각화 대시보드(출처: Sisense)

자세히 살펴보면 상단에 수치가 있고 중간에는 파이 차트, 하단에는 표가 나열돼 있어요. 이 데이터 시각화에서 중점적으로 봐야 하는 부분은 어디일까요? 중요한 정보가 무엇인지 쉽게 파악하기 어렵습니다. 파이 차트에 사용한 컬러도 데이터를 이해하기 어렵게 만드는 요소인데요, 같은 컬러가 중복으로 나타나 항목을 구분하기가 쉽지 않아요.

또한, 전체, 영국, 미국의 판매금액이 동일한 레이아웃으로 나열되어 있어 차트를 읽기 힘듭니다. 레이아웃이 똑같다면 필터를 넣어 필요한 내용을 필터링하는 것으로 구성해서 가독성을 높이는 방법이 데이터의 의미를 직관적으로 이해하는 데 도움이 될 거예요.

이처럼 데이터 시각화 대시보드를 제작할 때는 중요한 데이터는 무엇인지, 가독성이 떨어지지 않는지 등을 고려해야 하는데요, 데이터의 중요도를 파악해서 어떤 정보가 중요한지 순서를 정하고 위젯 크기와 위치를 고려해서 데이터 시각화 차트를 배치해야 합니다. 데이터 시각화 대시보드에서 가장 중요한 정보는 왼쪽 상단에 배치하고 오른쪽 아래로 갈수록 점점 덜 중요한 정보들을 배치하는 것이 좋습니다.

효과적인 데이터 시각화와 대시보드를 위한 4가지 체크 포인트

지금까지 효과적인 데이터 시각화와 대시보드를 제작하기 위한 4가지 체크 포인트를 살펴보았습니다. 어떤가요? 그동안 앞서 설명한 4가지 체크 포인트를 고려해서 데이터 시각화와 대시보드를 제작하셨나요? 

데이터 시각화와 데이터 시각화 대시보드를 만들고 효율적으로 활용하지 못하거나, 별다른 인사이트를 얻지 못했다면 이글에서 이야기한 4가지 체크 포인트를 고려해서 다시 만들어 보세요. 여러분의 실무에 큰 도움이 될 것이라고 생각합니다.  

개인적 용도가 아닌 회사 차원의 데이터 시각화 대시보드 제작이 필요하신가요? 데이터 시각화 대시보드 전문가의 도움이 필요하다면 뉴스젤리에 문의하세요! 다년간 데이터 시각화 프로젝트를 수행한 노하우를 바탕으로 사용자의 니즈를 반영한 맞춤형 데이터 시각화 대시보드를 기획⋅설계합니다. 


*참고
– Dashboards are Dead, Count Technologies
– Bad Dashboard Examples: 10 Common Dashboard Design Mistakes to Avoid, databox
– 10 Good and Bad Examples of Data Visualization, polymer
– 10 Rules of Dashboard Design, UX Design World
– Dashboard Design Best Practices – 4 Key Principles, sisense
– 10 rules for better dashboard design, Taras Bakusevych

본 글의 원문은 여기에서 볼 수 있습니다.

뉴스젤리 브랜드마케팅팀

help@newsjel.ly
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

형편없는 글 솜씨 때문에 직장생활이 힘겹다면?

비즈니스 글쓰기는 다릅니다. 기본적인 3가지 원칙을 지켜 반복 훈련하면 글 솜씨를 훨씬 발전시킬 수 있는데요. 그럼 상사 속 터지게 만드는 대표적인 비즈니스 글 3가지 유형을 살펴보고, 이런 글을 쓰지 않기 위해 명심해야 할 세 가지 원칙을 확인해볼까요?

티빙은 왜 한국프로야구 온라인 중계권을 샀을까?

왜 티빙은 3년 계약에 1,300억이 넘는 큰 금액을 투자해서 이 권리를 구매했을까요? 3년에 1,300억은 1년에 400억이 훨씬 넘는 금액을 투자한 것인데 그만큼의 가치가 있는걸까요? 기존에 온라인 중계권을 가지고 있던 네이버와 통신사 등의 컨소시엄보다 더 큰 금액을 투자해서 티빙은 무엇을 얻고자 하는걸까요? 

일론 머스크의 예측, 실현 가능성은?

일론 머스크는 위와 같이 AGI 즉 '범용 인공지능이 가장 똑똑한 인간보다 더 똑똑하다는 것으로 정의한다면, 2년 이내에 가능하게 될 것'이라고 언급했다.

잡스가 늘 직원들을 닦달한 말? “일 좀 벌이지 마!”

그런데 다들 ‘해야 할 일’에 집착할 때, 오히려 ‘하지 않아도 될 일’을 쳐내는데 집중한 사람이 있습니다. 바로 스티브 잡스인데요. 그는 늘 구성원들에게 "일 좀 벌이지 마!"라고 소리쳤다는데요. 대체 왜 그랬을까요?