[공공데이터] 온라인 쇼핑몰 상품군별 트렌드 변화

공공 데이터는 이전보다 구하기 쉬워졌습니다. 여전히 공급자 기준으로 데이터를 제공하는 경우가 있어서 활용하는 입장에서는 불편한 경우도 간혹 있지만, 확실히 이전보다 신뢰성 높은 다양한 데이터를 쉽게 구할 수 있는 점은 긍정적입니다.  

이번 시각화는 통계청에서 운영하는 국가통계포털(KOSIS)의 쇼핑 데이터를 활용했습니다.

데이터 시각화 순서는 다음과 같습니다.

  1. 국가통계포털에서 검색창에 ‘온라인 쇼핑몰 판매매체별 거래액 상품군별 거래액’을 입력합니다.

  2. 검색 결과 중 2017~2021로 표시되는 링크를 클릭하면 요약 정보를 볼 수 있는 팝업이 노출되는데, 이 때 시점을 2017년 1월부터 현재 최신 데이터까지 설정 후 ‘통계표 조회’ 버튼을 선택합니다.

  3. 조회한 기간의 거래액 데이터를 시각적으로 활용하기 위해 데이터를 다운로드 받습니다. 이 때 Excel 파일로 다운로드 받고자 하는 경우 가급적이면 ‘셀 병합’은 체크해제 하시기 바랍니다. 이유는 셀 병합은 사람 눈에 익숙한 방식으로 여러 항목을 입력하는 것이 비효율적이기 때문에 셀 병합을 하지만, 데이터 분석 과정에서는 셀 병합은 항목 (또는 변수)에 값을 누락시켜, 데이터의 신뢰성을 방해하는 요소일 수 있습니다.

  4. Excel과 같은 스프레드 시트 유형의 데이터 원본은 사람의 눈에 익숙한 방식으로 각 월별로 데이터가 열 방향으로 길게 표시가 됩니다. 이 경우에는 매달 데이터가 쌓이면 새로운 열(칼럼)이 생성이 되므로 데이터를 관리하는 측면에서나 분석하는 과정에서도 비효율적일 수밖에 없습니다. 따라서 열 방향으로 쌓이는 데이터를 행 방향으로 보내서 관리하고자 하는 칼럼 (변수 또는 필드)의 수를 줄이는 과정이 필요합니다. 흔히 열 방향의 데이터를 행 방향으로 변환 시키는 과정을 피벗(Pivot)이라고 합니다.
  5. 여기에서는 비교 형식의 데이터 시각화를 합니다. 비교 방식의 시각화는 동종 업계 내 경쟁사 (또는 브랜드, 제품 등) 비교를 하거나, 특정 이벤트를 기점으로 그 이전과 이후를 비교할 때 유용한 방식입니다.

    여기에서 활용한 데이터 원본의 기간은 2017년 1월부터 2021년 7월까지이며, 2021년 6월과 7월은 추정치입니다. 이 데이터 원본에는 총 23개의 상품군이 있으나, 여기에서는 비교하고자 하는 상품군에만 집중할 수 있도록 두 가지 상품군만 따로 색상을 진하게 강조하고 나머지 21개 상품군은 흐릿하게 설정합니다.

    그리고 비교를 위해 A 상품군은 파란색, B는 빨간색, 나머지 기타 상품군들은 회색으로 설정합니다.


    ‘여행 및 교통서비스’ 거래액 비교
    ‘음식 서비스’ vs ‘여행 및 교통서비스’ 거래액 비교


  6. 위 이미지에서 A는 음식 서비스로 2021년 7월 기준 추정 거래액은 2조 3,780억원입니다. B는 여행 및 교통 서비스로 8,220억원입니다. 이 둘을 비교했을 때 빨간색 부분인 여행 및 교통 서비스는 줄곧 1,2위를 다투던 섹터였으나, 2020년 초 발생한 코로나 팬데믹으로 인해 2020년 2월을 기점으로 이 둘의 거래액이 역전이 되면서 음식 서비스는 가파르게 상승하는 반면, 여행 및 교통 서비스는 팬데믹 이전으로 회복 되지 않는 것을 보여줍니다.

    상단에 있는 상품군 매개 변수는 변경이 가능합니다. 이번에는 A는 ‘가전,전자,통신기기’를 선택하고, B는 ‘화장품’을 선택하면 이 역시 코로나 팬데믹 이전에는 둘의 거래액 차이는 없었으나, 팬데믹 이후로는 추세가 다른 것을 쉽게 확인할 수 있습니다. 아무래도 재택 근무 및 온라인 수업으로 인해 IT 장비를 구매하는 것은 계속 증가하는 반면, 외출의 필수 요소인 화장품은 2020년 2월 이후로 정체 및 하락 추세인 것을 알 수 있습니다.

    아무래도 마스크를 벗게 되는 날이 오면 저 둘의 추세는 지금과는 다른 모습일 것 같습니다.


    ‘가전,전자,통신기기’ vs ‘화장품’ 거래액 비교
    ‘가전,전자,통신기기’ vs ‘화장품’ 거래액 비교

여러분들이 관심 있는 데이터로 시각화를 해봅시다. 그리고 시간이 지난 다음 새로운 데이터로 갱신하고 이전과 달라진 패턴이 있는지 살펴보는 것도 데이터 시각화하는 재미 요소 중 하나입니다. 아래 페이지에서 직접 코로나 팬데믹 전후 온라인 쇼핑몰 거래액을 비교 해보실 수 있습니다.

https://public.tableau.com/app/profile/seungilkang/viz/36252/sheet0

원본은 여기서 볼 수 있습니다.


필자는 데이터 시각화 전문 기업 BigxData에서 데이터 시각적 분석 전문가로 활동하면서, 데이터에 스토리텔링을 입히는 일을 주로 하고 있습니다.   

저서로는 ‘데이터 시각적 분석 태블로로 끝내기’, ‘태블로 굿모닝 굿애프터눈’이 있습니다.
다양한 데이터 시각적 분석 예시는 저자가 운영하는 유튜브 채널 (http://bit.ly/YT_MDV)에서 만날 수 있습니다.


강승일

viztabviz@gmail.com
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

가볍게 훑어보는 엔비디아 히스토리 ①리바TNT부터 지포스256까지 GPU의 시작

요즘 가장 뜨거운 기업은 엔비디아죠. 엔비디아는 왜 유명해졌고, 어떻게 성장해 왔는지, 또 지금 왜 가장 주목받는 기업이 되었는지 이야기를 풀어봅니다.

바쁘다 바빠 현대사회! 끝내지 못한 일때문에 괴롭다면?

끝내지 못한 일이 이들을 심리적으로 긴장하게 하고, 그 일에 미련을 갖게 해 더 오래 기억한 건데요. 이걸 자이가르닉 효과라고 합니다.

이제는 AGI를 준비해야 할 시기

이제는 생성형 인공지능을 뛰어넘는 범용 인공지능을 언급하는 시대가 도래하고 있어요. 여러 분야에 두루 쓰이는 인공지능이라면 인공지능을 필요로 하는 기업들의 까다로운 입맛에 잘 맞춰줄 수 있지 않을까요?

쿠팡은 와우 멤버십 가격을 왜 올린 걸까요?

작년 연말 기준으로 쿠팡 와우 멤버십 회원 수는 약 1,400만 명으로 알려져 있습니다. 2021년 말 무려 70%나 와우 멤버십 가격을 올렸을 때도, 회원 수가 줄기는커녕 더욱 늘어났는데요. 다만 이제는 현재 수준의 혜택으로 이 이상 멤버십 회원 수를 키우는 건 어렵다고 판단한 것이 아닐까 싶습니다. 그래서 결국 수익 확대의 길을 택하게 된 것일 거고요.