あなたならどうする
インタラクティブな分析ゲーム
よく来た、賢者よ
「あなたならどうする」を賢者アナリストとしてプレイしています。がんばってください!
毎年、観光客の数は 10 億人を超えています。また、全世界で観光客が旅行中に費やす金額は 8,850 億ドルを超えます。ですが、誰が、どこに旅行しているのでしょうか?
支出額が最も高いのはどの国からの観光客でしょうか?
行う作業
国名と観光支出額を使って散布図を作成してください。次に、Tableau で支出額により国をクラスタ化します。すると、(1) 米国は観光支出額が高い外れ値になっており、(2) ドイツとイギリスは同様に観光支出額が高い明らかな 2 番目のグループを形成している、ということがわかりやすくなります。
得られる結果
米国からの観光客は旅行中の支出額が、圧倒的に最も高くなっています。ドイツとイギリスからの観光客は 2 位です。
高度な分析テクニック
ここで行ったのは、クラスタリング (クラスタ分析) です。クラスタリングは、データポイントをグループ化するための統計手法です。互いに似通っており、他のグループのメンバーとは明らかに異なっているメンバーでグループを作成できるようにします。Tableau は、分散ベースの分割手法を使った K 平均法アルゴリズムを用いており、実行を繰り返しても一貫性が保たれます。詳しくは、「Tableau でのクラスタリングのしくみ」をご覧ください。
すると、次に知りたいことは...
このパターンはこれまで変わることがなかったのでしょうか?
行う作業
Tableau の [ページ] シェルフを使って、経時的な変化を分析しましょう。[ページ] シェルフにより、時間とともに変化するデータのビューをクリックで切り替えられるようになります。まず、観光支出額が高い国のセットを作成してください。その結果、米国、ドイツ、イギリスからの観光客は、近年の観光支出額でトップを占めており、その状況は長期間にわたって変わっていないことがわかります。
得られる結果
確かに少なくとも 1995 年以降は、米国からの観光客の支出額が最も高くなっています。しかし 2009 年には、海外観光支出額に何か不思議なことが起こっています...
分析テクニック
一連の項目を時間軸で等間隔の連続するポイントにプロットする、時系列分析を数秒で行いました。時系列分析は多くの場合、現在または将来の値に対する、過去の値の変化を表すために用いられます。また、異なってはいるものの関連性がある項目をまとめるセットも作成しました。
すると、最後の質問につながります。
どの国でも 2009 年に低下が見られます。何が起こったのでしょうか?
行う作業
Tableau で表計算を使い、入国者数と観光支出額における差の割合を経時的に表示してください。表計算により、ディメンション (この場合は時間) の全体で計算を行えます。すると、探していた谷がどちらのメジャーにも現れます。
得られる結果
2008 ~ 2009 年の期間、世界中の国々で、入国した観光客の合計数と観光支出額のどちらにも低下が見られます。2008 年の経済不況は、観光業界に大きな影響を及ぼしました。しかし不況後、米国の観光業は他国より大きく回復しています。
分析テクニック
ワンクリックで、データセット全体で差の割合 (2 つの値の差を 2 つのうち最初の値で割ったもの) を計算しました。