Search

데이터 시각화(EDA) 시리즈를 시작하며 : 시각화 공부를 시작하기 전에 알아둘 것들

데이터 시각화란?

데이터 시각화는 - 담백하게 정의하자면 - 숫자를 점, 선, 면(도형)을 활용해서 크기, 위치, 색상으로 표현하는 일이다. 데이터 시각화가 의미있는 근본적인 이유는 날것의 데이터/숫자보다 시각적 신호가 이해하고 기억하고 관련된 의사결정을 내리기 쉽기 때문이다.
사람의 뇌가 처리하는 시각 정보가 9Mb/sec 정도라고 하는데 사람의 두뇌는 시각적 정보를 잘 해석하도록 진화해 왔다. 한편, 엑셀을 볼 때는 cortisol이라는 스트레스 호르몬이 엄청 분비된다고 한다.

Medium, 매체로서의 데이터 시각화

데이터 시각화는 의미를 전달하기 위한 도구이고, 그렇기 때문에, 매체이다. Data Visualization이 데이터의 의미를 전달하는 매체로서 기능하기 위해서는 아래 네가지 질문이 중요하다.
어떤 데이터를 가지고 있나?
데이터를 통해 알고 싶은 게 무엇인가?
알고 싶은 걸 잘 알기 위해 어떤 시각화 방법이 효과적인가?
알고 싶은 것이 잘 표현되었나? 시각화 방법이 적절했나?

Abstraction, 현실의 추상화로서의 데이터 시각화

데이터 시각화는 현실의 추상화라고 할 수 있다. 데이터 수집은 현실 세계를 sampling하는 것이고, 데이터 시각화는 현실의 편린인 데이터 포인트들을 시각적 요소들을 사용하여 추상화(abstraction)하는 작업이다.
추상화의 과정에서 정보는 필연적으로 삭제/압축될 수밖에 없다. 사용자가 시각화에 사용된 시각적 신호(Visual Cues)를 해석할 수 없다면 시각화가 아무리 예쁘게 표현되었다 한들 실패한 데이터 시각화이다.
아래는 “Visual Cues”를 좌표 공간이나 지도 위에 표현하는 다양한 방법들을 도식화한 것으로 Nathan Yau - "Data Points: Visualization that means something" 책에서 인용하였다.

Statistical Narrative, 데이터 스토리텔링과 시각화

시각화는 종종 Storytelling의 새로운 형식으로 거론되기도 한다. 여기서 이야기라고 함은 전통적 서사라기보다는 통계적 이야기(statistical story)에 가깝겠다.
데이터 스토리텔링이 전통적 스토리텔링과 비교해서 더 큰 의미를 가질 수 있는 경우는 전통적 스토리텔링의 주된 소재가 되는 일화(anecdotal storytelling)의 일회성/우발성을 극복하고 데이터를 통해서 발견한 패턴을 이야기할 때이다. (anecdotal은 “입증되지 않은"이라는 뜻도 있다.)
즉, 데이터를 통해 일관되게 드러나는 패턴을 보여주고 결론으로 이끄는 귀납적 storytelling이 가능한 것이다.

관련 콘텐츠