데이터 시각화로 살펴보는 2022 선거 여정

민주주의의 꽃이 무엇인지 아시나요? 바로 선거입니다. 국민을 대표해서 나랏일 할 사람을 뽑는 선거는 정치에 참여하는 가장 쉽고 기본적인 일이에요. 선거기간이 되면 신문과 방송 등 언론에서 선거의 시작부터 끝까지 전 과정에 걸쳐 다양한 데이터 시각화 유형을 활용해 정보를 전달하는데요! 지지율, 유세 동선, 득표율 등 여러 가지 데이터를 효과적으로 보여주기 위한 최적의 방안이 데이터 시각화이기 때문이죠.

▵ 선거 과정 및 순서와 해당 시기에 볼 수 있는 지표 종류

오늘은 2022년 실시한 제20대 대통령선거와 제8회 지방선거를 바탕으로 선거 유세부터 투표, 그리고 개표를 거쳐 최종 당선 확정까지 선거의 전 과정을 따라가며 각 시기에 등장하는 지표와 시각화 유형을 자세히 살펴보도록 하겠습니다.

1. 선거 유세를 시작합니다

제8회 전국동시지방선거 기준 시·도지사 및 교육감은 선거 120일 전, 시·도의원, 구·시의원 및 장은 90일 전, 군의원 및 장은 60일 전부터 예비후보로 등록하고 제한적으로 유세할 수는 있으나 본격적인 선거 유세는 선거 당일은 포함한 14일 전인 공식 선거운동 기간에 진행됩니다. 

이 기간에는 주요 후보의 지지율은 물론, 공식 선거운동 첫날 어느 지역을 먼저 방문했는지와 선거운동이 마무리되면 어느 지역을 많이 방문했는지, 그리고 토론은 어떻게 진행되었는지 등 하루가 멀다 하고 관련 기사가 쏟아집니다. 구체적으로 어떤 내용이 담겼는지, 언론 매체의 시각화 사례를 가지고 이야기 해볼게요!

1) 어느 후보가 더 높은 지지율을 얻었을까요?

지지율은 공식 선거운동 기간 전부터 가장 자주 볼 수 있는 지표예요. 선거의 전체 판세를 가늠할 수 있는 직관적인 지표이기 때문에 다양한 여론조사 기관에서 지지율을 조사하고 발표합니다. 

아래 이미지는 제20대 대통령 선거를 앞두고 발표한 대선후보 지지율(2022년 1월 조사)입니다. 제20대 대통령 선거에서 후보로 공식 등록한 인원은 총 14명이었는데요, 가로 막대 차트(Horizontal Bar Chart)로 제작한 이 데이터 시각화는 5명의 데이터만을 막대로 담고 나머지 후보에 대한 데이터는 요약하여 차트 오른쪽에 숫자로 표시했습니다.

▵ 주요 대선후보 지지도를 나타낸 막대 차트(출처: 중부일보)

데이터의 크기에 따라 막대 길이를 다르게 표시하는 막대 차트는 항목별 지표값을 절대적・상대적으로 정확하게 표현할 수 있기에 여러 항목을 비교할 때 자주 사용하는 유형입니다. 

차트를 보면 가장 긴 막대로 표시한 더불어민주당 이재명 후보가 가장 앞선 지지율(41.4%)을 보이네요. 숫자가 없어도 막대의 길이를 비교하여 어느 후보의 지지율이 더 높은지 바로 확인할 수 있겠죠?

같은 지지율 지표를 가지고 전체 기간의 추이를 보고 싶을 땐 어떤 차트를 사용할까요? 두 가지 사례를 이야기해보려고 합니다!

아래 데이터 시각화도 제20대 대통령 선거의 지지율을 나타내는데요, 라인 차트(Line Chart)를 활용해서 2021년 12월부터 2022년 2월까지 이재명, 윤석열, 안철수 후보의 지지율 추이를 보여줍니다. 

▵ 이재명, 윤석열, 안철수 후보의 지지율 추이를 나타낸 라인 차트(출처: 한국일보)

시간의 흐름에 따라 달라지는 데이터의 추이를 나타낼 때 사용하는 라인 차트는 라인의 높낮이를 가지고 데이터의 변화를 파악합니다. 다만 위 시각화는 y축이 없는 형태라 데이터가 정확하게 시각화됐는지 확인이 어렵다는 점이 아쉽게 느껴지네요.

시계열 추이를 더 드라마틱하게 보여주는 경사 차트(Slope Chart)도 있습니다. 경사 차트는 두 가지 시점을 비교해서 데이터의 변화를 직관적으로 보여주는데 두 시점의 데이터를 연결한 라인의 방향과 기울기를 가지고 데이터의 변화를 판단할 수 있습니다. 

▵ 이재명, 윤석열 후보의 지지율 변화 추이를 보여주는 경사 차트(출처: JTBC)

경사 차트는 직관적으로 경사각이 크면 변화가 크고 작으면 변화가 작다는 사실을 알 수 있기에 보는 사람이 시각화를 이해하는 데 많은 시간을 쓰지 않아도 메시지에 집중할 수 있다는 점이 장점입니다. 

위 데이터 시각화를 보면 파란색으로 표시한 이재명 후보보다 빨간색으로 표시한 윤석열 후보의 경사각이 더 큽니다. 빨간색 라인이 아래쪽으로 향하는 것으로 보아 윤석열 후보의 지지율 변화가 더 크다는 사실을 알 수 있어요.(참고로 여론조사 기관이 다르기에 앞서 본 라인 차트의 지지율과 다른 수치가 나타납니다) 

2) 후보들은 유세를 위해 어느 지역으로 이동했나요?

본격 유세가 시작되면 후보들은 각 지역을 돌아다니며 유세를 시작합니다. 특히 공식선거운동 첫날 어느 후보가 어느 지역을 먼저 방문했는지에 많은 관심이 쏠려요. 처음 방문한 지역을 중요하게 생각한다는 의미이니까요. 

후보의 동선은 지도 위에 여러 지점을 연결한 이동 경로 지도(Route Map)로 나타냅니다. 화살표 방향에 따라 이동 경로를 알 수 있어요.

▵ 주요 대선후보의 공식선거운동 첫날 동선을 나타낸 이동 경로 지도 시각화(출처: 연합뉴스)

위쪽의 이동 경로 지도 시각화를 보면 윤석열 후보(빨간색)는 서울에서 대전을 거쳐 대구와 부산으로 갔고 이재명(파란색) 후보는 반대로 부산에서 시작해서 대구-대전-서울로 향했습니다. 안철수(주황색) 후보는 대구에서 시작해 구미와 김천, 영주를 거치는 영남권 유세에 집중했고요, 심상정(노란색) 후보는 익산을 시작으로 전주-광주-여수로 향하는 전남권 유세를 택했습니다. 주요 후보의 동선을 시각화한 이동 경로 지도를 보니 어느 지역에 유세를 집중하려 하는지 명확하게 알 수 있네요!

공식 선거운동기간이 끝나면 어느 후보가 어느 지역에 총 몇 번 방문했는지도 관심이 모입니다. 첫날 방문 지역만큼 여러 번 방문한 지역도 중요하다는 의미니까요. 

지도 시각화에 요소를 넣어 데이터의 크기를 비교하는 도형 표현도(Symbol Map)를 가지고 지역별 방문 횟수를 나타낼 수 있는데요, 도형 표현도는 지도 위에 도형의 크기로 데이터 값을 표현하는 유형입니다. 

▵ 오세훈・송영길 서울시장 후보의 권역별 선거 유세 방문 횟수를 시각화한 도형 표현도 (출처: 한국일보)

위 이미지는 제8회 전국동시지방선거의 서울시장 후보 오세훈・송영길이 유세를 위해 해당 지역을 몇 번 방문했는지를 보여주는 시각화입니다. 서울시 지도에 원을 사용하여 데이터의 차이를 나타내는데 숫자가 없으면 어느 지역에 더 많이 방문했는지 직관적으로 알기 어려울 것 같아요. 

그리고 하나 짚고 넘어가야 할 점은 데이터 시각화의 제목인데요! 위 데이터 시각화는 ‘오세훈・송영길 서울시장 후보 동선’이라는 제목을 붙였는데 실제 내용은 권역별 방문 횟수를 나타내고 있습니다. 제목과 시각화 차트가 전달하는 정보가 달라 보는 사람으로 하여금 헷갈리게 만드므로, 데이터 시각화에 적합한 차트 제목을 사용해야 한다는 점을 기억해두면 좋을 것 같습니다!

3) 누가 토론을 잘했나요?

일일이 발로 뛰는 지역 유세뿐만 아니라 공약과 주요 정책에 대한 이야기를 나누는 TV토론도 진행됩니다. 선거법에 의해 공영방송사(KBS・MBC)는 선거운동 기간 TV대담이나 토론회를 3회 이상 의무 개최해야 합니다. 

2022년 2월 3일 진행한 대선후보 4자 TV 토론을 평가한 데이터 시각화예요. 주도권, 설득력, 적합도, 안정감, 매력도의 다섯 가지 수치로 토론을 평가하고, 설문 결과 데이터를 바탕으로 레이더 차트(Radar Chart)를 제작했습니다. 

레이더 차트는 여러 평가 항목의 수치를 한 번에 볼 수 있는 데이터 시각화 유형으로 같은 간격으로 나눈 동심원 위에 수치에 따라 점을 찍고 선을 이어 그려진 도형의 모양을 가지고 분포를 파악합니다. 

▵ 주요 대선 후보의 TV토론 평가 결과를 시각화한 레이더 차트(출처: 아주경제)

레이터 차트를 보면 각 후보의 장단점과 TV토론의 평가 지표로 제시한 다섯 가지 항목간의 균형을 비교할 수 있습니다. 차트 위 도형이 크고 변형이 적을수록 점수가 높고 모든 능력이 뛰어나다는 의미입니다.

사실 후보별 TV토론 평가 결과를 나타낸 레이더 차트에서 오각형의 형태만 봤을 때는 각 후보가 어느 항목에 강점을 가지고 있는지, 어떤 후보가 다섯 가지 항목에서 고른 분포를 보였는지를 쉽게 인지하기 어려웠습니다.

오각형의 면적이나 형태에서 뚜렷하게 구분되는 점을 시각적으로 바로 확인할 수 없기 때문인데요, 결국 TV토론을 가장 잘한 후보는 오각형 안의 숫자를 보고 판단했을 거라고 생각해요. 활용 목적에 적합한 시각화 형태라고 보기 어려워 아쉬운 마음이 들었습니다. 

위와 같은 경우에 레이더 차트를 활용하더라도  보다 직관적인 의미를 전달할 수 있는 방법은 무엇이 있을까요? 네 후보의 점수가 모두 3.4~4.2 사이에 분포되어 있는데 위의 레이더 차트는 중심이 0부터 시작하기 때문에 소수점 한 자리의 작은 차이까지 시각화로 나타내지 못합니다. 중심 숫자를 3으로 변경한다면 소수점 한 자리의 차이를 두드러지게 보여줄 수 있을 거예요. 

이는 절대적인 수치보다 상대적인 비교가 더 중요한 데이터이기 때문에 시도해 볼만한 방법입니다. 하나 더, 후보의 데이터를 비교해서 보여주고 싶은 거니까  막대 차트를 선택했어도 직관적이었을 것 같아요. (레이더 차트에 관해 자세히 알고 싶다면 <레이더 차트에 관한 (거의) 모든 것>을 추천합니다) 

2. 투표하셨나요?

여러분은 이번 제8회 전국동시지방선거에서 소중한 한 표를 행사하셨나요? 선거하면 모두의 관심이 집중되는 지표, 투표율을 시각화한 사례를 살펴보겠습니다. 

1) 투표율은 얼마나 될까요?

투표율이 높으면 야당에, 낮으면 여당에 유리하다는 통설이 있었는데 이번 제8회 전국동시지방선거는 전국 50.9%로 낮은 투표율을 보였습니다. 현재 여당인 국민의힘이 대부분의 지역에서 승리했고요. 제20대 대통령선거는 77.1%, 제7회 전국동시지방선거는 60.2%의 투표율과 비교해보면 확연히 차이가 납니다.

선거구는 시·도의 관할 구역 내에서 인구, 행정구역, 교통 등의 조건을 고려하여 구·시·군을 단위로 획정합니다. 전국 단위인 대통령 선거에서도 지역별 민심을 확인하기 위해 지역별 데이터를 활용하지만 특히  지방선거와 국회의원선거(총선거)는 지역 단위로 당선자를 선출하기에 지역별 데이터를 잘 보여줘야 합니다. 

아래 데이터 시각화는 제8회 전국동시지방선거의 시도별 사전투표율을 나타낸 단계 구분도(Choropleth Map)입니다. 보통 행정 구역을 기준으로 수집된 데이터를 표현하는데 많이 쓰이는데 컬러가 짙게 나타날수록 데이터가 크다는 의미입니다.

▵ 제8회 전국동시지방선거 시도별 사전투표율을 나타낸 단계구분도(출처: 연합뉴스)

단계구분도를 보면 전남 지역은 짙은 남색, 경기, 대전, 광주, 대구, 울산, 부산 등은 회색에 가까운 연한 파란색이 보입니다. 컬러 범례와 함께 보면 전남 지역 투표율이 가장 높고, 경기, 대전, 광주, 대구, 울산, 부산 등은 사전 투표율이 20%를 넘지 못한 상태임을 알 수 있어요. 

이 시각화는 지역마다 데이터 값(숫자)을 표시했지만 숫자가 없더라도 색의 농도만으로 어느 지역의 투표율이 높은 지 파악할 수 있겠죠?

다음은 사전투표율과 당일투표율을 비교한 데이터 시각화 사례를 보겠습니다. 최종투표율은 사전투표율과 당일투표율을 합산해서 집계하는데, 한국리서치에서 제작한 시각화를 보면 사전투표율과 당일투표율을 산점도(Scatter Plot)로 시각화하여 투표율의 상관관계를 보여줍니다.

산점도는 데이터 간의 관계를 보여주는 데이터 시각화 유형입니다. 항목별 데이터를 값에 따라 점을 찍어 표시하는데 점의 분포가 왼쪽 하단에서 오른쪽 상단으로 이어지면 양의 상관관계, 왼쪽 상단에서 오른쪽 하단으로 이어지면 음의 상관관계가 있다고 이야기합니다.

▵ 각 지역별 사전투표율과 당일투표율을 비교한 산점도(출처: 여론 속의 여론)

위의 데이터 시각화에서 x축은 각 지역별 사전투표율을, y축은 당일투표율을 나타냅니다.전투표율이 높은 지역일수록 당일투표율이 낮은 경향을 보이네요. 점이 하나의 직선 가까이 모여 있을수록 상관관계가 강한데요, 이 산점도 역시 직선 주위에 점이 분포하고 있어 사전투표율과 당일투표율은 밀접한 연관이 있음을 알 수 있습니다. 

3. 어느 후보가 당선됐을까요?

오후 6시, 투표가 끝나면 방송사는 출구조사 결과를 발표하고 개표방송을 진행합니다. 방송사마다 다채로운 그래픽을 활용한 개표방송이 화제가 되기도 했죠. 개표가 진행될수록 당선자의 윤곽이 드러나고 가장 많은 표를 받은 후보가 최종 당선됩니다. 

1) 지역별 득표율은 어떻게 되나요?

투표율과 마찬가지로 득표율도 지역별 표심을 확인하기 위해 지도 시각화 유형을 많이 사용합니다. 앞서 투표율에서 소개한 단계 구분도 뿐만 아니라 특정한 데이터 값에 따라 지역의 모양을 변형한 카토그램(Cartogram) 등이 자주 눈에 띄어요. (<선거철 모르면 곤란한 데이터 시각화, 카토그램>을 읽으면 카토그램에 관한 자세한 내용을 알 수 있어요)

▵ 제8회 전국동시지방선거의 기초단체장 당선 현황을 시각화한 단계구분도(좌)와 카토그램(우)(출처: 뉴시스 / 중앙일보

아래 이미지는 제20대 대통령 선거 결과를 나타낸 단계구분도입니다. 앞서 투표율 사례에서 언급했던 것처럼 단계구분도는 컬러를 가지고 데이터를 구분하는데 이 데이터 시각화는 한 단계 더 나아가 파이차트를 가지고 각 지역별 상세 데이터를 나타내고 있어요.

▵ 제20대 대통령 선거 결과를 나타낸 지도 시각화(출처: 한국경제)

하나씩 짚어보면 중심에 지도 시각화(단계 구분도)를 기준으로 지역별 득표율을 표시한 파이 차트가 보이고요, 상단에는 막대 차트가 있습니다. 오른쪽 가운데에는 19대 대선 결과도 있네요. 다양한 정보를 제공하기는 하지만, 한편으로 아쉬운 점을 쉽게 찾을 수 있었어요.

데이터 시각화는 데이터의 의미를 직관적으로 보기 위함인데 이 사례는 여러 유형이 하나의 이미지에 모두 들어가 있어 오히려 혼란을 줍니다. 여러 정보를 전달하고 싶다면, 목적을 구분해 차트를 따로 그리는 편이 더 좋습니다. 

또한, 단계 구분도에 사용한 컬러와 도넛 차트에 사용한 컬러가 다르고 19대 대선 결과에 사용한 컬러도 달라서 해당 컬러가 무슨 의미인지 분명하지 않습니다. 물론 빨간색과 파란색 계열을 사용하고 선거 데이터이기 때문에 경험적으로 빨간 계열은 국민의힘 윤석열 후보, 파란 계열 더불어민주당 이재명 후보라는 것을 인지할 수도 있지만 컬러의 의미를 확실히 구분하는 범례가 필요합니다.  

2) 당선을 확정합니다

개표가 끝나고 당선이 최종 확정됐습니다. 보통은 앞서 본 사례처럼 당선 데이터도 지도 시각화 유형을 활용하지만, 정당별 의석수가 특히 중요한 국회의원 선거 같은 경우 전체 의석수 가운데 각 정당이 차지하는 비율을 요약하는 형태로 최종 당선자 데이터를 시각화합니다. 

아래 이미지는 올해는 아니지만 지난 2020년 4월 15일 실시한 제21대 국회의원선거 결과를 시각화한 게이지 차트(Gauge Chart)입니다. 일반적인 게이지 차트는 막대 형태이나 총선 결과를 나타낼 때는 이를 변형하여 점을 찍는데요, 게이지 차트에 점이 찍힌 모습을 보면 자연스럽게 국회 본회의장이 떠오르기 때문입니다.

▵ 제21대 국회의원선거의 정당 의석수를 나타낸 게이지 차트(출처: 오마이뉴스)

점의 개수는 의석수를 나타내고, 점이 모여 만든 조각의 크기로 전체 데이터에서 차지하는 비중을 알 수 있습니다. 전체(300석)의 과반(150석) 의석을 넘으면 제한적으로나마 단독 법안을 처리할 수 있는 권한이 생기기 때문에 게이지 차트를 활용하여 어느 정당이 의석을 얼마나 차지했는지를 쉽게 파악할 수 있도록 한 것이 아닐까 추측해봅니다.

게이지 차트에 점을 찍은 시각화와 비슷한 형태로 최근 치러진 제8회 전국동시지방선거의 서울・경기・인천 지역의 구・시・군장 당선 현황을 요약해봤습니다. 수도권 지역의 표심이 한눈에 보이나요?

This image has an empty alt attribute; its file name is 도트-최종-1.png
▵ 제8회 전국동시지방선거 결과를 요약한 시각화(제작: 뉴스젤리

점 하나가 하나의 의석을 표시하고 빨간색은 국민의힘, 하늘색은 더불어민주당, 회색은 무소속에서 당선됐다는 의미입니다. 서울, 경기, 인천 모두 국민의힘이 대부분의 의석을 차지했네요. 

다른 사람이 만든 데이터 시각화를 탐구하는 것을 넘어 직접 시각화를 제작해보니 데이터가 더욱 친근하게 느껴졌어요. 

에디터의 한마디

선거의 시작부터 끝까지 사용되는 데이터 시각화의 유형이 상당히 다양했습니다. 분량이 넘쳐서 더 소개하고 싶은 사례를 빼야할 만큼요! 

데이터 시각화는 전국 단위로 치러지는 선거의 방대한 데이터를 나타내야 하는 만큼 중요한 역할을 하고 있습니다. 지표마다 비슷한 유형을 사용하는데 그 유형이 데이터의 의미를 가장 잘 보여주기 때문이 아닐까요? 

이번 콘텐츠를 통해 선거 관련 데이터와 시각화 유형에 익숙해졌기를 바라며, 2024년 국회의원 선거, 2027년 대통령 선거 등 이후에도 계속 이어지는 선거철마다 마주하게 될 데이터 시각화를 통해 여러 인사이트를 얻으셨으면 합니다. 


*참고자료
– 김수언, [대선후보 여론조사] 경기도민 대선 후보 지지도 이재명41.4% vs 윤석열29.5%, 중부일보, 22.01.04.
– 인현우, ‘2차 토론·尹 발언 후’ 윤석열 43.5% 이재명 40.4%…오차 범위 내 접전, 한국일보, 22.02.14.
– 연지환, [JTBC 여론조사] 이재명·윤석열 격차 더 벌어졌다…안철수도 상승세, JTBC, 22.01.03
– 장예진, [연합시론] 대선 공식 선거운동 돌입, 22일 남은 선택의 시간, 연합뉴스, 22.02.15.
– 권오혁・장관석, 22일간 李 5266㎞-尹 5954㎞ 이동…수도권 유세 李 47회-尹 42회, 동아일보, 22. 03. 09.
– 박준석, [르포] 오세훈 “시의회 3분의 2만 이기게 해달라”… 자신감 속 ‘쌍끌이’ 전략, 한국일보, 22. 05. 30.
– 이성휘·박경은·김슬기, [대선 토론 전문가 평가] 李 기대치 높았나 ‘3.44점’…尹 3.76점 ‘선방’, 沈 3.64점 安 3.48점, 아주경제, 22.02.04
– 박영석, [그래픽] 6.1 지방선거 시도별 사전투표율, 연합뉴스, 22.05.28.
– 이동한, [20대 대선 특집] 사전투표율 분석 – 사전투표율과 후보 득표율과의 관계는, 한국리서치 여론속의 여론, 22.03.16.
– 안지혜, [그래픽] 6·1 지방선거 기초단체장 정당별 당선 현황, 뉴시스, 22.06.02.
– 백민정, 박태이, 김영옥, 지방권력 교체…카토그램으로 보는 6·1 지방선거, 중앙일보, 22.06.03.
– 고은이, “집값 급등에 세금 폭탄”…’부동산 분노’가 서울 승패 갈랐다, 한국경제, 22.03.10.
– 제21대 국회의원선거 안내, 오마이뉴스

본 글의 원문은 여기에서 볼 수 있습니다.

뉴스젤리 브랜드마케팅팀

help@newsjel.ly
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

쿠팡은 와우 멤버십 가격을 왜 올린 걸까요?

작년 연말 기준으로 쿠팡 와우 멤버십 회원 수는 약 1,400만 명으로 알려져 있습니다. 2021년 말 무려 70%나 와우 멤버십 가격을 올렸을 때도, 회원 수가 줄기는커녕 더욱 늘어났는데요. 다만 이제는 현재 수준의 혜택으로 이 이상 멤버십 회원 수를 키우는 건 어렵다고 판단한 것이 아닐까 싶습니다. 그래서 결국 수익 확대의 길을 택하게 된 것일 거고요.

형편없는 글 솜씨 때문에 직장생활이 힘겹다면?

비즈니스 글쓰기는 다릅니다. 기본적인 3가지 원칙을 지켜 반복 훈련하면 글 솜씨를 훨씬 발전시킬 수 있는데요. 그럼 상사 속 터지게 만드는 대표적인 비즈니스 글 3가지 유형을 살펴보고, 이런 글을 쓰지 않기 위해 명심해야 할 세 가지 원칙을 확인해볼까요?

티빙은 왜 한국프로야구 온라인 중계권을 샀을까?

왜 티빙은 3년 계약에 1,300억이 넘는 큰 금액을 투자해서 이 권리를 구매했을까요? 3년에 1,300억은 1년에 400억이 훨씬 넘는 금액을 투자한 것인데 그만큼의 가치가 있는걸까요? 기존에 온라인 중계권을 가지고 있던 네이버와 통신사 등의 컨소시엄보다 더 큰 금액을 투자해서 티빙은 무엇을 얻고자 하는걸까요? 

일론 머스크의 예측, 실현 가능성은?

일론 머스크는 위와 같이 AGI 즉 '범용 인공지능이 가장 똑똑한 인간보다 더 똑똑하다는 것으로 정의한다면, 2년 이내에 가능하게 될 것'이라고 언급했다.