나만의 분석 탐험
대화형 분석 게임
참여해 주셔서 감사합니다, 예언자님.
예언자 분석가로 나만의 분석 탐험을 실행합니다. 행운을 빕니다.
여행을 하는 관광객의 숫자는 연간 10억 명이 넘습니다. 이러한 관광객들은 전 세계적으로 8,850억 달러가 넘는 비용을 여행에 사용합니다. 그런데 이러한 관광객들은 누구입니까? 그리고 어디로 여행을 합니까?
어떤 국가의 관광객들이 가장 많은 비용을 지출합니까?
탐험 방식:
국가 이름 및 관광 지출로 분산형 차트를 만듭니다. 그런 다음 Tableau에서 지출별로 국가 클러스터를 만듭니다. (1) 미국이 관광 지출이 높은 이상값을 보여 주며 (2) 독일과 영국도 관광객들의 지출이 높은 두 번째 그룹을 형성한다는 것을 쉽게 확인할 수 있습니다.
알아낸 내용:
현재까지는 미국의 관광객들이 여행 중 가장 많은 비용을 지출합니다. 독일과 영국의 관광객들이 그 다음으로 많은 비용을 지출합니다.
고급 분석 기법:
여기에서는 클러스터 분석이 사용되었습니다. 클러스터 분석은 데이터 요소를 그룹화하는 데 사용되는 통계적 방법입니다. 이 기법은 서로 유사한 멤버끼리 그룹으로 만들어 다른 그룹 멤버와는 명확하게 구분되게 도와 줍니다. Tableau는 분산 기반 파티셔닝 방법이 포함된 k-평균 클러스터 분석 알고리즘을 사용하므로 실행 간 일관성이 보장됩니다. Tableau에서 클러스터 분석이 작동하는 방식에 대해 자세히 알아보십시오.
이제 다음과 같은 내용이 궁금할 수 있습니다.
비용이 지출되는 지역은 어디입니까?
선택한 작업:
별도의 파일로 보유하고 있는 관광 지출에 대한 지역별 추세 데이터를 봅니다. 두 데이터 집합을 사용하여 지역별 연간 지출 금액을 시각화하고 Tableau에서 추세선을 드래그하여 결과 그래프 궤적을 확인합니다.
알아낸 내용:
지역별 관광 지출에 중요한 추세가 나와 있습니다. 그것을 어떻게 알 수 있습니까? p-값은 0.05보다 훨씬 작고 R 제곱 값은 1에 근접하기 때문에 알 수 있습니다(자세한 내용은 온라인 도움말 참조). 해석: 대부분의 데이터 요소가 식별된 추세선에 매우 근접하므로 이 모델은 이 데이터에 매우 적합합니다. 특히 아시아 태평양 지역의 관광 지출은 다른 지역보다 빠르게 증가하는 것 같습니다.
고급 분석 기법:
여기에서는 추세 분석을 수행했습니다. 추세 분석에서는 시간에 따른 동일한 값의 변화를 비교하여 연관된 변수 간 관계를 보여 줍니다. 지역별 시장 데이터로 교차 데이터베이스 조인도 수행했습니다. 교차 데이터베이스 조인에서는 보다 완벽한 분석을 위해 여러 데이터 집합의 데이터를 통합합니다.
이제 다음과 같은 내용이 궁금할 수 있습니다.
앞으로 아시아 태평양 지역의 성장에 태국이 얼마나 기여할 수 있을까요?
탐험 방식:
전 세계 관광 지출에 대한 영향력이 점점 더 커지고 있는 아시아 태평양 지역에서 태국의 기여도를 조사합니다. 2013년에는 태국이 관광객으로부터 얻은 수입이 470억 달러이나 2014년에는 수입이 420억 달러임을 확인할 수 있습니다. Tableau에서 R 모델을 만들어 2013년 관광 수입 수준을 넘기 위해 필요한 관광객 수를 예측합니다.
알아낸 내용:
태국이 새로운 수입 목표를 달성하려면 2,900만 명의 관광객이 더 필요합니다.
고급 분석 기법:
예측 모델링 특히 다중 선형 회귀를 위해 R 통합을 사용했습니다. R은 대규모 데이터 집합에 대한 정교한 분석과 예측적 분석을 수행하는 데 사용되는 프로그래밍 언어입니다. Tableau를 통해 R에서 이전에 만들어진 모델을 활용하여 분석을 더욱 확장할 수 있습니다.