세부 수준(LOD) 표현식의 이해
분석에서 LOD 표현식을 사용하고 활용하는 방법에 대해 알아보십시오.
Tableau에서는 데이터 분석을 통해 즐거운 경험을 하게 만드는 것을 목표로 삼고 있습니다. 사람들은 Tableau를 집중적으로 사용할 때 제품의 사용 방법에 대해 고민하지 않고 데이터에 대한 질문을 하며 즐겁게 사용할 수 있다고 말합니다. Tableau에서는 이러한 경험을 흐름, 다시 말해 즐겁게 작업에 몰입해 있는 상태라고 부릅니다.
문제를 해결하기 위해 도구 사용법에 대해 고민해야 한다면 분석 흐름이 깨집니다. 이러한 현상의 일반적인 원인 중 하나는 다양한 세부 수준으로 집계된 데이터로 작업해야 하기 때문입니다. 일반적으로 질문하는 것은 간단하지만, 답변을 구하는 과정에는 어려움이 따릅니다. 이러한 질문의 예는 다음과 같습니다. 분기별로 회사의 주문이 100개 이상이었던 일 수를 파악할 수 있습니까?
Tableau 9.0에서는 이러한 유형의 질문에 대한 답변을 찾을 수 있도록 세부 수준(LOD) 표현식이라는 새로운 구문을 도입했습니다. 이 새로운 구문은 세부 수준 질문에 직접 대응할 수 있도록 함으로써 Tableau의 계산 언어를 간소화하는 동시에 확장합니다.
이 백서에서는 LOD 표현식의 작동 방법과 여러 유형의 LOD 표현식에 대한 자세한 설명 및 각 사용 사례에 대해 설명합니다.
백서의 처음 몇 페이지를 읽으실 수 있도록 발췌했습니다. 나머지 내용을 읽으려면 오른쪽에서 PDF를 다운로드하십시오.
LOD 표현식의 작동 방법—'세부 수준' 설명
데이터 탐색의 핵심은 원본의 구조를 이해하는 데 있습니다. 예를 들어 가장 세부적인 수준이 주소별로 나열된 레스토랑 검사 데이터가 있다고 가정해 보겠습니다. 데이터를 집계하여 우편 번호, 구/군/시, 시/도 또는 국가별로 속성을 확인해 보려고 합니다.
Tableau에서는 일반적으로 원하는 차원(예: 구/군/시, 시/도)을 뷰에 드롭하여 이러한 작업을 수행할 수 있습니다. 뷰에 추가하도록 선택한 차원에 따라 데이터가 '비주얼라이제이션 세부 수준' 즉, 비주얼라이제이션 LOD로 집계됩니다.
여기에서의 핵심 포인트는 LOD 표현식을 사용하면 세부 수준(예: 차원)을 비주얼라이제이션에 실제로 드롭하지 않고도 계산에서 사용되는 세부 수준을 결정할 수 있다는 것입니다. 비주얼라이제이션 LOD와 독립적으로 계산을 수행할 세부 수준을 정의할 수 있습니다.
레스토랑 검사 데이터를 사용하는 다음 예의 경우 뷰에 다음 두 개의 차원이 추가되었습니다. 구/군/시 및 시/도.
뷰에 있는 데이터는 비주얼라이제이션 LOD를 기반으로 집계되었습니다. 즉, 이 경우 구/군/시 및 시/도로 구성되며 초기 데이터 원본에 비해 보다 세부적으로 집계되었습니다. 이미지에서 선택된 지점은 에든버러 지역의 뉴브리지에 있는 모든 레스토랑의 평균 사용자층을 나타냅니다.
뷰에 더욱 세부적인 차원을 추가하면 비주얼라이제이션 LOD의 집계 수준이 낮아집니다. 예를 들어 Business ID(비즈니스 ID)를 비주얼라이제이션의 세부 정보 선반에 드롭하여 추가하면 개별 비즈니스별 평균 사용자층을 볼 수 있습니다. 이렇게 하면 비주얼라이제이션도 변경됩니다. 각 개별 비즈니스가 맵에서 원으로 표시됩니다. 하지만 비주얼라이제이션을 변경하지 않으려면 어떻게 해야 할까요? 비즈니스 ID별 총 고객층을 결정하고 구/군/시별 해당 값의 평균을 구하고 구/군/시별로 원을 하나씩만 표시하려면 어떻게 해야 할까요? 구/군/시별 각 레스토랑의 평균 고객 수를 파악하려고 합니다.
이렇게 하려면 비주얼라이제이션에 차원을 드래그하지 않고 뷰에 차원을 추가해야 합니다. LOD 표현식을 사용하면 이 작업을 수행할 수 있습니다.
Fans per Business(비즈니스별 고객 수)라는 새 계산된 필드를 만들어 보겠습니다. 구문에 대한 간단한 소개는 다음과 같습니다.
(Image hidden)
이 표현식을 사용하면 비주얼라이제이션에 사용된 다른 차원과 관계없이 Tableau에서 각 Business ID(비즈니스 ID)에 대한 집계를 수행합니다. LOD 표현식을 사용하여 Business ID(비즈니스 ID)별 총 User Fans(사용자 수)를 계산할 수 있습니다. 이 새 필드를 뷰에 드래그한 다음 구/군/시별 해당 값에 대한 평균을 구할 수 있습니다.
LOD 표현식에 FIXED 연산자를 사용하면 Business ID(비즈니스 ID)별로 평균 사용자 수가 더 많은 구/군/시에 대한 정보를 얻을 수 있습니다. 즉, 파란색이 더 진한 구/군/시는 인기 있는 레스토랑이 더 많다(또는 해당 구/군/시의 인구가 더 많고 이에 따라 레스토랑별 사용자 수가 더 많음)는 것을 의미합니다.
LOD 표현식 키워드에는 EXCLUDE, INCLUDE 및 FIXED의 3가지 유형이 있으며 각 키워드는 LOD 표현식의 범위를 다르게 지정합니다.