나만의 분석 탐험
대화형 분석 게임
참여해 주셔서 감사합니다, 현자님.
현자 분석가로 나만의 분석 탐험을 실행합니다. 행운을 빕니다.
여행을 하는 관광객의 숫자는 연간 10억 명이 넘습니다. 이러한 관광객들은 전 세계적으로 8,850억 달러가 넘는 비용을 여행에 사용합니다. 그런데 이러한 관광객들은 누구입니까? 그리고 어디로 여행을 합니까?
어떤 국가의 관광객들이 가장 많은 비용을 지출합니까?
탐험 방식:
국가 이름 및 관광 지출로 분산형 차트를 만듭니다. 그런 다음 Tableau에서 지출별로 국가 클러스터를 만듭니다. (1) 미국이 관광 지출이 높은 이상값을 보여 주며 (2) 독일과 영국도 관광객들의 지출이 높은 두 번째 그룹을 형성한다는 것을 쉽게 확인할 수 있습니다.
알아낸 내용:
현재까지는 미국의 관광객들이 여행 중 가장 많은 비용을 지출합니다. 독일과 영국의 관광객들이 그 다음으로 많은 비용을 지출합니다.
고급 분석 기법:
여기에서는 클러스터 분석이 사용되었습니다. 클러스터 분석은 데이터 요소를 그룹화하는 데 사용되는 통계적 방법입니다. 이 기법은 서로 유사한 멤버끼리 그룹으로 만들어 다른 그룹 멤버와는 명확하게 구분되게 도와 줍니다. Tableau는 분산 기반 파티셔닝 방법이 포함된 k-평균 클러스터 분석 알고리즘을 사용하므로 실행 간 일관성이 보장됩니다. Tableau에서 클러스터 분석이 작동하는 방식에 대해 자세히 알아보십시오.
이제 다음과 같은 내용이 궁금할 수 있습니다.
항상 이 패턴이었습니까?
탐험 방식:
시간에 따른 데이터 뷰를 클릭할 수 있는 Tableau의 페이지 선반을 사용하여 시간에 따른 변화를 분석합니다. 높은 관광 지출을 기반으로 한 국가 집합을 만듭니다. 미국, 독일 및 영국 관광객들이 최근 몇 년 동안 관광 지출에서 선두를 지켜 왔으며, 이러한 상황은 상당 기간 변화되지 않았습니다.
알아낸 내용:
네, 적어도 1995년 이후로는 미국 관광객들이 가장 많은 비용을 지출하고 있습니다. 그런데 2009년 국제 관광 지출에서 재미있는 일이 발생했습니다.
분석 기법:
연속적이며 동일한 간격의 시점에 일련의 항목을 표시하는 시계열 분석을 몇 초 만에 수행했습니다. 이 분석은 현재나 미래 값에 대해 과거 값의 변화를 표현하는 데 자주 사용됩니다. 고유하면서도 관련된 항목들을 모은 집합도 만들었습니다.
다음과 같은 최종 질문으로 이어질 수 있습니다.
2009년에는 모든 국가에서 하락을 나타냈습니다. 무슨 일이 있었습니까?
탐험 방식:
Tableau에서 테이블 계산을 사용하여 시간에 따른 입국 관광객 수와 관광 지출의 비율 차이를 표시합니다. 테이블 계산을 사용하면 특정 차원, 이 경우 시간에 따른 값을 계산할 수 있습니다. 두 측정값 모두에서 찾고 있는 하락을 확인할 수 있습니다.
알아낸 내용:
2008년과 2009년 사이에는 전 세계 국가의 전체 입국 관광객 수와 관광 지출 모두에서 하락을 나타냈습니다. 2008년의 경제 불황이 관광 업계에 큰 영향을 주었으나 미국의 관광 산업은 불황 이후 다른 국가보다 더 많이 회복되었습니다.
분석 기법:
한 번의 클릭으로 전체 데이터 집합에 대한 비율 차이 즉, 두 값의 차이를 초기값으로 나눈 값을 계산했습니다.