데이터가 있고 질문이 있습니다. 필요한 해답을 얻기 위해 이 데이터를 시각화하는 가장 좋은 방법은 무엇일까요? 데이터를 효과적인 비주얼리제이션 또는 대시보드로 전환하는 과정은 데이터 활용을 위한 첫 번째 단계입니다.
주기율표를 만든 Henry D. Hubbard는 “그래프에는 마법과 같은 요소가 있어서 전염병, 공황, 호황기 등 전체적인 상황을 곡선의 형태로 순식간에 보여줄 수 있습니다. 곡선은 정보를 마음에 새기고, 상상력을 불러일으키며, 사람을 설득하는 힘이 있습니다.”라고 말했습니다.
이 문서에서는 막대 차트부터 히트 맵, 상자-수염 차트 등 다양한 차트 및 그래프 유형에 대해 알아볼 수 있습니다. 또한 각 유형의 적절한 용도와 이러한 유형의 차트를 최대한 활용하는 방법에 대한 팁도 찾을 수 있습니다.
막대 차트
막대 차트는 데이터를 시각화할 때 가장 일반적으로 사용되는 방법 중 하나입니다. 이 차트를 사용하여 범주 사이에서 데이터를 신속하게 비교하고, 차이점을 하이라이트하며, 추세와 이상값을 표시하고, 전체 최고값과 최저값을 한눈에 파악할 수 있습니다. 막대 차트는 여러 개의 범주로 분할할 수 있는 데이터를 표현하려는 경우에 특히 효과적입니다. 다양한 사이즈별 셔츠 수, 방문자별 웹 트래픽 또는 부서별 지출 비율 등이 좋은 예에 해당합니다.
팁:
- 막대에 색상을 추가하면 시각적인 효과를 높일 수 있습니다. 색상을 사용하면 시각적으로 빠르게 구분되므로 쉽게 비교할 수 있습니다.
- 누적 막대 또는 병렬 막대를 사용합니다. 누적 막대와 병렬 막대 차트를 사용하여 데이터를 세분화하면 더욱 심층적으로 분석할 수 있습니다.
- 막대 차트와 맵을 조합하여 사용합니다. 맵은 데이터를 시각화하는 강력하고 직관적인 방법입니다. 뷰어는 맵을 필터로 사용해 드릴다운하고 상세한 답변을 찾을 수 있습니다.
- 축의 양쪽에 막대를 배치합니다. 같은 축을 따라서 증가 및 감소하는 데이터 요소를 만들면 추세와 이상값을 제대로 표시할 수 있습니다.
라인 차트
라인 차트 또는 라인 그래프는 분리된 여러 데이터 요소를 연결하여 하나의 연속적인 변화로 보여줍니다. 라인 차트를 사용하면 시간 경과에 따른 전반적인 데이터 추세를 볼 수 있습니다(예: 5년 동안의 주가 변동 또는 해당 월의 웹 사이트 페이지 방문 수). 이를 통해 간단하고 명확한 방법으로 한 값을 다른 값과 비교하여 그 변화를 시각화할 수 있습니다. 그러나 라인 차트는 시간에만 사용되지 않습니다. 수평 축에 여러 가지 차원(예: 날짜 유형, 시간 간격 및 순서형 데이터 등)을 사용할 수 있습니다.
팁:
- 라인 그래프와 막대 차트를 조합하여 사용합니다. 막대와 라인 차트는 멋지게 조합됩니다. 같은 축에 두 종류의 정보를 표시하면 데이터의 컨텍스트가 더욱 보강됩니다.
- 라인 아래 영역에 음영을 넣습니다. 라인 차트 아래의 음영을 넣으면 수량에 대한 즉각적인 시각적 효과를 제공하며 그래프의 외관과 느낌을 개선할 수 있습니다. 그래프 내에 여러 개의 라인이 있는 경우 여러 가지 색상을 사용하면 각 라인의 전체에 대한 상대적 기여도를 뷰어에게 표시할 수 있습니다.
파이 차트
파이 차트는 다른 비주얼리제이션에 세부 정보를 추가하는 데 유용합니다. 그러나 파이 차트 자체만으로는 뷰어에게 정보를 빠르고 정확하게 비교하는 방법을 제공할 수 없습니다. 뷰어가 컨텍스트를 직접 만들어야 하므로 데이터의 핵심 요소를 놓치게 됩니다. 파이 차트는 대시보드의 중심점으로 사용되는 것보다 다른 비주얼리제이션을 드릴다운하는 데 더욱 적합합니다. 이 방식은 파이 차트의 단순성을 이용하므로 큰 그림에 방해를 주지 않으면서 정보를 추가합니다.
팁:
맵
맵은 우편번호, 약어로 표시한 주, 국가 이름, 사용자 지정 지오코딩 등을 포함하여 모든 위치 정보를 시각화할 수 있는 손쉬운 방법입니다. 데이터와 관련이 있는 지리 정보를 표시해야 하는 경우, 맵은 데이터 내의 추세와 위치가 어떤 관계인지 보여주는 간단하고 매력적인 방법입니다. 주별 보험금 청구액, 국가별 제품 수출 지역, 우편번호별 자동차 사고 건수, 주문품 판매 지역 등이 좋은 예에 해당합니다.
팁:
- 다른 유형의 차트, 그래프 및 테이블을 위한 필터로 맵을 사용합니다. 맵은 데이터를 상세하게 분석하는 직관적인 방법입니다. 뷰어는 전체적인 추세를 한눈에 파악할 수 있으며, 필터를 사용하여 세부 정보를 빠르게 확인할 수 있습니다.
- 맵 위에 데이터 요소 층을 만듭니다. 맵 위에 마크를 겹쳐서 개별 데이터 요소를 더 정밀하게 표시할 수 있습니다. 마크의 크기를 다양하게 설정하여 분석에 더 많은 시각적 세부 정보를 추가할 수 있습니다.
히트 맵
히트 맵은 맵에서 겹쳐 표시되는 마크로 인하여 표시되지 않을 수 있는 패턴 또는 상대적인 집중도를 보여주므로 더 많거나 적은 개수의 데이터 요소에서도 위치를 식별할 수 있습니다. 히트 맵은 좁은 지리적 영역 안에 수많은 데이터 요소가 있는 데이터 집합 작업의 경우에 가장 효과적입니다.
팁:
분산형 차트
분산형 차트는 다양한 변수 사이의 관계를 조사하여 한 변수가 다른 변수를 잘 설명하는지 또는 독립적으로 변하는 경향이 있는지 보여주는 효과적인 방법입니다. 분산형 차트는 한 개의 차트 위에 수많은 개별 데이터 요소를 표시합니다. 클러스터 분석이나 추세선과 같은 분석 방법을 사용하여 차트를 보강할 수 있습니다. 예를 들어, 이 차트를 사용하여 기술 초기 어댑터와 지연된 구매 패턴 또는 다양한 제품 범주의 다양한 지역에 대한 배송 비용을 시각화할 수 있습니다.
팁:
- 세그먼트를 확인하려면 클러스터 분석을 사용합니다. 클러스터 분석은 선택한 변수에 따라 데이터 요소를 개별 세그먼트 그룹으로 만듭니다.
- 하이라이트 동작을 사용합니다. 분산형 차트에 하이라이트 동작을 추가하면 나머지 데이터 집합 표시는 그대로 유지된 상태에서 어떤 요소에 공통 특성이 있는지 빠르게 알 수 있습니다.
- 사용자 지정 마크 유형을 사용합니다. 사용자 지정 마크는 차트에 선명한 시각적 효과를 추가하여 서로 다른 요소 그룹을 확실하게 구분해줍니다.
Gantt 차트
Gantt 차트는 프로젝트 일정을 표시하거나 시간에 따른 활동 변경 사항을 설명합니다. Gantt 차트는 리소스 할당과 함께 다른 단계를 시작하기 전에 끝내야 하는 단계를 설명합니다. 그러나 Gantt 차트는 프로젝트에만 사용되지 않습니다. 예를 들어, 팀의 장치 사용 시간이나 사용 가능한 플레이어의 수와 같이, 이 차트 유형으로 시계열과 관련된 모든 데이터를 표시할 수도 있습니다.
팁
- 색상을 추가합니다. Gantt 차트 내 막대의 색상을 변경하면 변수의 중요 측면을 사용자에게 빠르게 전달할 수 있습니다.
- 맵 및 다른 차트 유형을 Gantt 차트와 조합하여 사용합니다. Gantt 차트를 다른 차트 유형과 함께 대시보드에 추가하면 별도로 보이던 데이터 사이의 상관 관계를 파악할 수 있습니다.
버블 차트
버블이 기술적으로 고유한 비주얼리제이션 유형은 아니지만, 버블 기법을 사용하면 3개 이상의 측정값 사이의 관계를 표시하기 위해 분산형 차트나 맵으로 세부 정보를 추가할 수 있습니다. 원의 크기와 색상을 다양하게 변경하면 많은 양의 데이터를 한눈에 볼 수 있는 시각적으로 매력적인 차트를 만들 수 있습니다.
팁
- 색상을 추가합니다. 색상을 사용하면 버블 차트에 차원을 추가하고 매력적인 시각적 강조 효과를 구현할 수 있습니다.
- 맵 위에 버블 차트를 겹쳐서 놓습니다. 버블 차트를 사용하면 데이터의 상대적인 집중도 정보를 뷰어에게 빠르게 전달할 수 있습니다. 이렇게 겹쳐서 놓으면 지리적으로 관련된 데이터의 컨텍스트를 뷰어에게 보여줄 수 있습니다.
히스토그램 차트
히스토그램 차트는 개별 그룹에서 데이터가 분포된 상태를 보여줍니다. 히스토그램은 데이터를 특정한 범주("빈"이라고도 함)로 그룹화한 후, 각 범주의 레코드 개수에 비례하는 막대를 지정합니다. 이 차트 유형을 사용하면 기업 규모별 고객의 수, 학생의 시험 성적이나 제품의 결함 빈도 등을 시각화할 수 있습니다.
팁
- 다양한 데이터 그룹화를 시도해 봅니다. 다양한 히스토그램을 만들면 유용한 데이터 그룹화를 결정할 때 도움이 될 수 있습니다.
- 색상을 추가하여 구간차원을 구분합니다. 각 그룹을 대표하는 막대에 색상을 적용하여 같은 차트에서 두 번째의 범주 집합을 표시합니다.
불릿 차트
불릿 차트를 사용하면 진행률과 목표를 빠르게 비교할 수 있습니다. 불릿 그래프는 막대 차트를 응용한 그래프입니다. 대시보드 게이지, 미터, 온도계를 대체하기 위해 고안된 불릿 차트는 더 작은 공간을 사용하지만 더 많은 정보를 표시하고 더 많은 비교 요소를 제공합니다. 불릿 차트는 시간에 따른 기록을 표시하지 않으므로 깊이 있는 분석에 사용하는 것보다 대시보드에서 '현재 상태'를 빠르게 알려줄 때 사용하는 것이 가장 좋습니다.
팁
- 성과 기준치를 색상으로 표시합니다. 배경 색상을 지정하여 뷰어가 목표 대비 성과 측정 방법을 더 잘 이해할 수 있도록 도울 수 있습니다.
- 요약 인사이트를 얻기 위해 대시보드에 불릿을 추가합니다. 대시보드에서 불릿 차트와 다른 유형의 차트를 조합하여 사용하면 목표를 달성하기 위해 어떤 부문에 노력을 집중해야 하는지에 관해 생산적인 토론을 진행할 수 있습니다.
하이라이트 테이블
하이라이트 테이블을 사용하면 히트 맵을 더 효과적으로 사용할 수 있습니다. 하이라이트 테이블은 정확한 값을 표시하면서 색상도 사용하므로 뷰어의 주의를 집중시킬 수 있습니다. 타겟 마케팅의 세그먼트 분석, 지역별 제품 채택률, 담당자별 영업 리드 등이 좋은 예에 해당합니다.
팁
- 하이라이트 테이블과 다른 차트 유형을 조합하여 사용합니다. 예를 들어, 하이라이트 테이블을 사용하여 라인 차트를 보강하면 뷰어는 특정 관심 사항으로 드릴다운하는 중에도 전체적인 데이터 추세를 여전히 염두에 둘 수 있습니다.
트리맵
트리맵은 데이터의 다양한 세그먼트와 전체를 연관시킵니다. 트리맵이라는 이름에서 알 수 있듯이, 트리맵의 각 사각형은 전체에 대한 자신의 비율에 따라 더 작은 사각형 또는 하위 가지로 분할됩니다. 트리맵은 공간을 효율적으로 사용하여 각 범주의 비율 합계를 보여줍니다.
팁
- 범주별로 사각형에 색상을 지정합니다. 히트 맵은 밀도가 매우 높은 차트 유형이므로 색상을 사용하면 뷰어가 한 범주와 다른 범주를 쉽게 구분할 수 있습니다.
- 트리맵과 막대 차트를 조합하여 사용합니다. 막대 차트를 사용하면 뷰어는 막대의 길이에 따라 항목을 빠르게 비교하는 동시에 각 막대 안에 포함된 범주의 세부 사항까지 확인할 수 있습니다.
상자-수염 차트
상자-수염 차트 또는 박스 플롯은 데이터 분포를 표시하는 일반적인 방법입니다. 차트의 이름은 다이어그램을 구성하는 두 부분을 의미합니다. 상자에는 데이터의 중앙값 및 제1사분위수와 제3사분위수(중앙값보다 25% 큰 값과 25% 작은 값)가 포함되며, 수염은 일반적으로 사분위수 간 범위(제1사분위수와 제3사분위수 간의 차이)의 1.5배 영역 내에 있는 데이터를 나타냅니다. 수염은 또한 데이터 내의 최대값 및 최소값을 표시하는 데 사용할 수도 있습니다.
팁
- 박스 내의 요소를 숨깁니다. 이를 통해 뷰어는 이상값에 집중할 수 있습니다.
- 범주 차원 전체에서 박스 플롯을 비교합니다. 박스 플롯은 데이터 집합 사이에서 분포를 빠르게 비교할 때 가장 좋습니다.
캔들 차트
캔들 차트는 상자-수염 차트를 생각나게 할 수도 있지만, 이들은 다른 차트입니다. 일반적으로 캔들 차트는 일정 기간 동안 금융 상품에 대한 메트릭을 표시하는 재무 분석에서 많이 사용합니다. 이 차트 유형은 시간에 따른 상품의 시가, 종가, 고가, 저가를 쉽게 이해되는 형식으로 보여줍니다.
팁
- 여러 개의 개별 캔들 차트를 표시합니다. 한 개의 차트에 너무 많은 데이터 요소의 층을 만들면 혼란스럽고 탐색하기 힘들 수 있습니다. 명확하게 구분되도록 만들어야 뷰어가 차트를 개별적으로 분석하는 데 도움이 됩니다.
- 데이터의 상관 관계를 나타내려면 하이라이트 동작을 사용합니다. 시계열 데이터는 추적하기 어려울 수 있습니다. 하이라이트 동작을 사용하면 차트의 나머지에 있는 전체적인 정보를 계속 보면서 하나의 날짜에 집중할 수 있습니다.