머신러닝 및 딥러닝/데이터 시각화

데이터 시각화란? (데이터 시각화 툴, 예제)

삡삐in오즈 2021. 4. 8. 09:26
728x90
반응형

 

 

데이터 시각화란?

데이터 시각화(data visualization)는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정을 말한다.
- 위키백과


데이터를 통해 누군가에게 무언가를 소통을 하기 위해 꼭 필요한 데이터 시각화.
요즘에는 데이터 분석가에게 꼭 필요한 스킬 중에 하나이기도 합니다.

숫자, 테이블 형식의 데이터보다는 막대차트나 선 도표 같은 차트가 데이터를 한 눈에 파악하기 쉽습니다.

밑에는 책 웹사이트 Goodreads의 책 평점 데이터입니다.
아무래도 테이블 형식보다는 오른쪽으로 봤을 때 한눈에 평점의 분포를 파악하기에 쉽습니다.

Goodreads 책 평점 데이터

 


좋은 데이터 시각화란?

좋은 데이터 시각화란 아무래도 전달하는 메시지가 정확하게 전달이 되어야 하는 게 목표인 거 같습니다.
'좋은' 데이터 시각화에는 크게 두 가지의 요소를 충족해야 합니다.

1. 정확한 데이터를 전달해야 한다.
내가 전달하려는 메시지를 과정 해서도, 왜곡하여도 안되고 오해의 여지가 없어야 합니다.

❌안좋은 예)
애플 쇼케이스에 등장한 파이 차트를 보면 애플의 시장 점유율을 강조하려고 파이 차트를 살짝 눕힌 것을 볼 수 있습니다.
그 덕분에(?) 애플 시장 점유율 (초록색) 19.5%가 21.2% (보라색) 보다 더 커 보이는 매직을 볼 수 있습니다.

매직


2. 보기에 좋아야 한다 aesthetically pleasing
아무리 정확한 메시지가 존재하더라도 보기에 힘들면 아무래도 메시지를 전달하기에는 힘듭니다.
색 조합, 글꼴, 배치 여러 가지 디자인적인 요소를 생각하여 만들어야 합니다.

❌안좋은 예) 아이유 님의 파워포인트


✔️좋은 예) 뉴스 웹사이트 The Economist의 Graph in Detail

왼쪽: Economist 오른쪽: 동아 뉴스


Economist의 그래프 코너에서 들고 온 차트를 보면 딱 봤을 때 깔끔하고 표현하고자 하는 메시지 (락다운 이후의 교통사고 증가)가 잘 보입니다.

동아 뉴스의 차트 역시 불필요한 정보 없이 줄어드는 출산율을 표현


데이터 시각화 툴 tool

너무 다양한 데이터 시각화 툴이 존재하지만 제가 써본 세 개를 간단히 설명해보겠습니다.

  • 파이썬 라이브러리: Matplotlib, Seaborn, ggplot

아마 파이썬으로 데이터 분석을 공부하시는 분이라면 한 번씩은 사용해봤을 만한 라이브러리들입니다.

순서대로: matplotlib, seaborn, ggplot 예제 하나씩

파이썬으로 데이터를 정리하고 바로 차트를 그릴 수 있는 장점이 큰 거 같습니다. 또 라이브러리 documentation이 잘 정리되어있고 예제와 많아 쉽게 따라 할 수 있는 것 또한 큰 장점입니다.

개인적으로 seaborn이 디자인적으로 마음에 들어 자주 사용하고 있습니다.

  • 태블로 Tableau

태블로는 시각화 분석 플랫폼으로 요즘에 많이 쓰는 듯합니다.

장점은 아무래도 시각화 분석 위주의 플랫폼이라 누구나 쉽게 쓰게 되어있는 편입니다.
단점은 아직은 커뮤니티가 작은 편이라 찾고 싶은 내용을 찾기가 힘든 편입니다.

  • 자바스크립트 라이브러리: D3

파이썬 라이브러리처럼 자바스크립트 언어를 알아야 사용 가능합니다.

D3 갤러리에서 가져온 차트

D3 Gallery 구경하러 가기장점과 단점이 같은 D3.. 정말 하나하나 일일이 코딩을 하는 거라 정말 오래 걸리는 대신 표현하는데 매우 flexible 하고 파워풀합니다. 또 다른 큰 장점으로는 interactive 한 요소를 넣을 수 있습니다. 마우스 오버, 줌인, 시간 따라 움직이는 다양한 element 추가 가능합니다. (갤러리에서 보는 걸 추천. 밑에 자바스크립트 코드도 포함)

배우는데 어려운 편이지만 그만큼 가치가 있는 라이브러리입니다



위 툴 외에도 정말 너무 많고 다양한 데이터 시각화 툴이 존재합니다, Google Charts, Grafana, Datawrapper, ChartBlocks...... (구글에 'Best Data Visualization tools'를 검색하면 나오는 툴만 몇십 개)


👍 개인적인 추천:
데이터 분석을 이제 시작하는 분이라면 -> 파이썬 라이브러리
데이터 분석보다는 시각화 위주로 일을 하거나 배우고 싶은 분들에겐 -> 태블로 (또는 비슷한 시각화용 플랫폼)
프로그래밍을 어느 정도 하시는 분이라면 자바스크립트 D3.js를 추천합니다.


앞으로 다양한 시각화 예제와 코드를 올려볼 예정입니다.
감사합니다 :)

 

728x90
반응형