DESIGN

데이터 시각화 형태 고르는 법

요약 👉 데이터 시각화 형태 고르는 방법


🔗 이 글은 한봄소리님이 브런치에 올린 아티클을 요약한 글입니다.

수집한 데이터를 상대방에게 표현할 때 어떤 시각화 방법을 선택해야 가장 잘 전달할 수 있을까요? 데이터를 시각화 하는 방법은 수없이 많지만, 목적에 맞는 차트는 생각보다 선택 할 종류가 제한되어 있습니다.

데이터 시각화 이론에서 가장 많이 활용되고 있는 표는 앤드류 아벨라(Andrew V. Abela)의 차트 선택 방법이 있습니다. 앤드류는 무엇을 보여주고 싶은지 목적에 따라 크게 비교(Comparison), 분포(Distribution), 구성(Comparison), 관계(relationship)의 카테고리로 차트를 구분하고 있습니다.

앤드류의 데이터 시각화 방법을 정리한 표가 궁금하시다면 원문 링크를 참조해주시기 바랍니다.

🙆‍♀️ 테이블을 잘 사용하는 경우

  • 개별 값을 비교하거나 조회하는 경우
  • 정확한 값을 보여줘야 함
  • 값에 측정 단위가 여러 개일 경우
  • 양적 정보를 전달하는것이 목적

🙅‍♀️ 테이블을 잘못 사용하는 경우

  • 추세를 보여줘야 하는 경우
  • 형태를 바탕으로 메세지를 전달하고 싶은 경우
  • 여러 값 간의 관계를 표현하고 싶은 경우

🙆‍♀️ 막대 차트를 잘 사용하는 경우

  • 시간 축이 있는 경우 가로 축을 시간으로 설정 (시간은 위에서 아래가 아닌 왼쪽에서 오른쪽으로)
  • 세로 숫자 축은 0에서 시작하기
  • 구성 항목이 4개 이하일 때, 구성 비중이 비교적 유사할 때 누적 차트를 사용
  • 카테고리 이름이 긴 경우 가로 막대 차트를 사용
  • 범주가 7~15개 이거나, 음수로 집합을 표시하는 경우 가로 막대 차트 사용
  • 구성 항목 간 비중만 중요할 경우 100% 누적 차트를 사용

🙆‍♀️ 라인 차트를 잘 사용하는 경우

  • 시간 등 연속적인 데이터를 표시하는 경우
  • 데이터 포인트 수가 매우 많을 때(20개 이상) 일정 기간 동안 트렌드를 표현하는 경우

🙅‍♀️ 라인 차트를 잘못 사용하는 경우

  • 간격의 크기가 동일하지 않은 경우 (값이 0인 경우라도 값을 건너뛰지 않기)
  • 차트의 종횡비를 과도하게 늘리거나 줄이는 경우 (1:1 비율이 가장 인식하기 좋음)

🙆‍♀️ 영역 차트를 잘 사용하는 경우

  • 시간에 따른 누적되는 가치를 표현하는 경우
  • 시간 경과에 따른 구성 항목 별 변화를 나타내는 경우

🙅‍♀️ 영역 차트를 잘못 사용하는 경우

  • 주식 시장이나 가격 변동과 같이 변동되는 값을 표시하는 경우

🙆‍♀️ 파이 차트, 도넛 차트를 잘 사용하는 경우

  • 카테고리의 전체 관계 혹은 일부 지배적인 구성을 시각화 하는 경우

🙅‍♀️ 파이 차트, 도넛 차트를 잘못 사용하는 경우

  • 표현하고자 하는 카테고리가 너무 많은 경우 (사람은 면적 비교에 약합니다)
  • 각 카테고리의 값이 유사한 경우 (개별 카테고리를 비교하거나 정확한 값을 나타내기 위함이 아님)
  • 누적 도넛 차트를 사용하는 경우. 대다수 누적 막대 차트가 더 나은 결과를 제공합니다
  • 모든 카테고리의 합이 100%가 아닌 경우
  • 비교하고자 하는 축이 2개 이상인 경우

🙆‍♀️ 분산 차트(Scatter Plot)를 잘 사용하는 경우

  • 연관되거나 서로 다른 두 변수의 관계를 표현하는 경우
  • Outlier를 파악하거나 데이터 분포를 클러스터링 하는 경우

🙆‍♀️ 버블 차트를 잘 사용하는 경우

  • 분산 차트의 축(2개) 보다 하나 더 많은 3개의 축으로 비교하는 경우