🔗 이 글은 한봄소리님이 브런치에 올린 아티클을 요약한 글입니다.
수집한 데이터를 상대방에게 표현할 때 어떤 시각화 방법을 선택해야 가장 잘 전달할 수 있을까요? 데이터를 시각화 하는 방법은 수없이 많지만, 목적에 맞는 차트는 생각보다 선택 할 종류가 제한되어 있습니다.
데이터 시각화 이론에서 가장 많이 활용되고 있는 표는 앤드류 아벨라(Andrew V. Abela)의 차트 선택 방법이 있습니다. 앤드류는 무엇을 보여주고 싶은지 목적에 따라 크게 비교(Comparison)
, 분포(Distribution)
, 구성(Comparison)
, 관계(relationship)
의 카테고리로 차트를 구분하고 있습니다.
앤드류의 데이터 시각화 방법을 정리한 표가 궁금하시다면 원문 링크를 참조해주시기 바랍니다.
🙆♀️ 테이블을 잘 사용하는 경우
- 개별 값을 비교하거나 조회하는 경우
- 정확한 값을 보여줘야 함
- 값에 측정 단위가 여러 개일 경우
- 양적 정보를 전달하는것이 목적
🙅♀️ 테이블을 잘못 사용하는 경우
- 추세를 보여줘야 하는 경우
- 형태를 바탕으로 메세지를 전달하고 싶은 경우
- 여러 값 간의 관계를 표현하고 싶은 경우
🙆♀️ 막대 차트를 잘 사용하는 경우
- 시간 축이 있는 경우 가로 축을 시간으로 설정 (시간은 위에서 아래가 아닌 왼쪽에서 오른쪽으로)
- 세로 숫자 축은 0에서 시작하기
- 구성 항목이 4개 이하일 때, 구성 비중이 비교적 유사할 때 누적 차트를 사용
- 카테고리 이름이 긴 경우 가로 막대 차트를 사용
- 범주가 7~15개 이거나, 음수로 집합을 표시하는 경우 가로 막대 차트 사용
- 구성 항목 간 비중만 중요할 경우 100% 누적 차트를 사용
🙆♀️ 라인 차트를 잘 사용하는 경우
- 시간 등 연속적인 데이터를 표시하는 경우
- 데이터 포인트 수가 매우 많을 때(20개 이상) 일정 기간 동안 트렌드를 표현하는 경우
🙅♀️ 라인 차트를 잘못 사용하는 경우
- 간격의 크기가 동일하지 않은 경우 (값이 0인 경우라도 값을 건너뛰지 않기)
- 차트의 종횡비를 과도하게 늘리거나 줄이는 경우 (1:1 비율이 가장 인식하기 좋음)
🙆♀️ 영역 차트를 잘 사용하는 경우
- 시간에 따른 누적되는 가치를 표현하는 경우
- 시간 경과에 따른 구성 항목 별 변화를 나타내는 경우
🙅♀️ 영역 차트를 잘못 사용하는 경우
- 주식 시장이나 가격 변동과 같이 변동되는 값을 표시하는 경우
🙆♀️ 파이 차트, 도넛 차트를 잘 사용하는 경우
- 카테고리의 전체 관계 혹은 일부 지배적인 구성을 시각화 하는 경우
🙅♀️ 파이 차트, 도넛 차트를 잘못 사용하는 경우
- 표현하고자 하는 카테고리가 너무 많은 경우 (사람은 면적 비교에 약합니다)
- 각 카테고리의 값이 유사한 경우 (개별 카테고리를 비교하거나 정확한 값을 나타내기 위함이 아님)
- 누적 도넛 차트를 사용하는 경우. 대다수 누적 막대 차트가 더 나은 결과를 제공합니다
- 모든 카테고리의 합이 100%가 아닌 경우
- 비교하고자 하는 축이 2개 이상인 경우
🙆♀️ 분산 차트(Scatter Plot)를 잘 사용하는 경우
- 연관되거나 서로 다른 두 변수의 관계를 표현하는 경우
- Outlier를 파악하거나 데이터 분포를 클러스터링 하는 경우
🙆♀️ 버블 차트를 잘 사용하는 경우
- 분산 차트의 축(2개) 보다 하나 더 많은 3개의 축으로 비교하는 경우