[주식 & 뉴스 데이터] 2차 전지 섹터 경쟁사 비교 대시보드

2차 전지 섹터 상장사인 LG화학과 SK이노베이션의 주식과 뉴스 데이터를 수집 후 비교 대시보드를 제작해보겠습니다.

먼저 아래 대시보드는 LG화학과 SK이노베이션의 주식 데이터는 2020년 1월 이후 데이터를 수집했고, 뉴스는 최근 뉴스를 각각 수집했습니다. 데이터 출처는 각각 네이버 금융 및 네이버 뉴스 검색 결과입니다.

라인과 뉴스보기 버튼은 각 회사의 주요 컬러를 반영했습니다.
라인과 뉴스보기 버튼은 각 회사의 주요 컬러를 반영했습니다.

 

비교 대시보드를 구성하기 위해 왼쪽은 LG화학, 오른쪽은 SK이노베이션 기준으로 화면을 배치했습니다. 우선 상단에는 각 회사별 CI를 배치하고 그 사이에 대시보드 제목을 넣었습니다.

그 하단에는 2020년 1월 이후 양사의 주식 흐름을 라인 차트로 구성했고, 그 하단에는 최근 날짜 종가 기준 요약 수치를 제공합니다.

그리고 각 회사의 최근 주요 뉴스 10개 리스트를 배치하고, ‘뉴스보기’ 버튼을 클릭하면 해당 뉴스의 원본 기사 링크 페이지로 이동하도록 설정했습니다.

이번에는 앞선 화면을 모바일 화면 기준으로 적용했습니다.

가로 400px, 세로 600px로 설정한 다음에 수집한 뉴스링크를 연동해 ‘뉴스보기’ 버튼을 클릭하면 해당 뉴스 페이지로 이동하도록 설정했습니다. 그리고 이 화면을 조직 내 공유를 통해 임원 혹은 리더들이 이동중에도 회사 주요 뉴스를 빠르게 확인할 수 있을 것입니다. 

이동중에도 실시간으로 데이터를 확인할 수 있도록 모바일 기준으로 제작한 대시보드입니다.
이동중에도 실시간으로 데이터를 확인할 수 있도록 모바일 기준으로 제작한 대시보드입니다.

 

이동중에도 실시간으로 데이터를 확인할 수 있도록 모바일 기준으로 제작한 대시보드입니다.
이동중에도 실시간으로 데이터를 확인할 수 있도록 모바일 기준으로 제작한 대시보드입니다.

 

데이터 수집 방법은 주식과 뉴스 데이터 모두 구글 스프레드시트를 활용해 수집했습니다.

우선 주식은 네이버 금융에 있는 각 종목별 시세 데이터를 가져왔습니다.

예를 들어 아래 URL 페이지에서 code 값에 나오는 6자리는 KOSPI 종목코드이며, LG화학은 ‘051910’, SK이노베이션은 ‘096770’입니다.

LG화학 https://finance.naver.com/item/sise.nhn?code=051910

SK이노 https://finance.naver.com/item/sise.nhn?code=096770

구글 시트에서 새 스프레드시트 오픈한 다음에 A1 셀에 다음과 같이 입력합니다.

=IMPORTHTML("https://finance.naver.com/item/frgn.nhn?code=051910","table",3)

IMPORTHTML = 테이블 또는 리스트 형태 웹페이지를 불러옵니다

번째 “ “ 안에는 수집하려는 URL 입력합니다.

번째 “ “ 안에는 테이블 형태는 “table”, 리스트 형태는 “list” 입력합니다.

번째는 해당 URL table 기준으로 번째인지 입력합니다.

여기에서 시세 테이블은 3번째 테이블입니다.

그리고 1페이지부터 수집하려는 페이지는 각각의 시트를 만들어 수집 유니온 방식으로 연결 데이터 시각화를 합니다.

이번에는 뉴스 데이터를 수집하겠습니다.

회사를 네이버에서 검색 발생하는 쿼리를 기준으로 해당하는 URL 입력 수집하고자 합니다. 스프레드시트를 열어 A1 셀에 아래와 같이 입력합니다.

query 해당하는 부분이 찾고자 하는 검색 쿼리이기 때문에 LG화학 대신 SK이노베이션으로 수집하고자 하면 해당 query 변경하시면 됩니다.  

=IMPORTXML("https://search.naver.com/search.naver?where=news&sm=tab_jum&query=LG%ED%99%94%ED%95%99","//div[3]/ul/li/div/div")

이전 주식 데이터와 달리 IMPORTXML로 입력하는 이유는 단순히 테이블을 수집하는 것이 아니라 웹 페이지 내 특정한 영역만 골라서 가져오기 위해 IMPROTXML을 활용했습니다.

 

원문은 여기서 볼 수 있습니다.

필자는 데이터 시각화 전문 기업 BigxData에서 데이터 시각적 분석 전문가로 활동하면서, 데이터에 스토리텔링을 입히는 일을 주로 하고 있습니다. 저서로는 ‘데이터 시각적 분석 태블로로 끝내기’, ‘태블로 굿모닝 굿애프터눈’이 있습니다. 저자가 운영하는 유튜브 채널 (http://bit.ly/YT_MDV)에서 만날 수 있습니다.

 

강승일

viztabviz@gmail.com
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

형편없는 글 솜씨 때문에 직장생활이 힘겹다면?

비즈니스 글쓰기는 다릅니다. 기본적인 3가지 원칙을 지켜 반복 훈련하면 글 솜씨를 훨씬 발전시킬 수 있는데요. 그럼 상사 속 터지게 만드는 대표적인 비즈니스 글 3가지 유형을 살펴보고, 이런 글을 쓰지 않기 위해 명심해야 할 세 가지 원칙을 확인해볼까요?

티빙은 왜 한국프로야구 온라인 중계권을 샀을까?

왜 티빙은 3년 계약에 1,300억이 넘는 큰 금액을 투자해서 이 권리를 구매했을까요? 3년에 1,300억은 1년에 400억이 훨씬 넘는 금액을 투자한 것인데 그만큼의 가치가 있는걸까요? 기존에 온라인 중계권을 가지고 있던 네이버와 통신사 등의 컨소시엄보다 더 큰 금액을 투자해서 티빙은 무엇을 얻고자 하는걸까요? 

일론 머스크의 예측, 실현 가능성은?

일론 머스크는 위와 같이 AGI 즉 '범용 인공지능이 가장 똑똑한 인간보다 더 똑똑하다는 것으로 정의한다면, 2년 이내에 가능하게 될 것'이라고 언급했다.

잡스가 늘 직원들을 닦달한 말? “일 좀 벌이지 마!”

그런데 다들 ‘해야 할 일’에 집착할 때, 오히려 ‘하지 않아도 될 일’을 쳐내는데 집중한 사람이 있습니다. 바로 스티브 잡스인데요. 그는 늘 구성원들에게 "일 좀 벌이지 마!"라고 소리쳤다는데요. 대체 왜 그랬을까요?