あなたならどうする
インタラクティブな分析ゲーム
よく来た、予言者よ
「あなたならどうする」を予言者アナリストとしてプレイしています。がんばってください!
毎年、観光客の数は 10 億人を超えています。また、全世界で観光客が旅行中に費やす金額は 8,850 億ドルを超えます。ですが、誰が、どこに旅行しているのでしょうか?
支出額が最も高いのはどの国からの観光客でしょうか?
行う作業
国名と観光支出額を使って散布図を作成してください。次に、Tableau で支出額により国をクラスタ化します。すると、(1) 米国は観光支出額が高い外れ値になっており、(2) ドイツとイギリスは同様に観光支出額が高い明らかな 2 番目のグループを形成している、ということがわかりやすくなります。
得られる結果
米国からの観光客は旅行中の支出額が最も高く、圧倒的と言えます。ドイツとイギリスからの観光客は 2 位です。
高度な分析テクニック
ここで行ったのは、クラスタリング (クラスタ分析) です。クラスタリングは、データポイントをグループ化するための統計手法です。互いに似通っており、他のグループのメンバーとは明らかに異なっているメンバーでグループを作成できるようにします。Tableau は、分散ベースの分割手法を使った K 平均法アルゴリズムを用いており、実行を繰り返しても一貫性が保たれます。詳しくは、「Tableau でのクラスタリングのしくみ」をご覧ください。
すると、次に知りたいことは...
お金はどこで使われているのでしょうか?
行う作業
別のファイルにある、観光支出額の地域的な傾向のデータを表示します。次に 2 つのデータセットを使い、地域ごとに毎年の支出額を視覚化します。そして、Tableau で傾向線をドラッグして得られるグラフの傾向を確認してください。
得られる結果
地域別の観光支出額には、明らかな傾向が見られます。なぜわかるかと言えば、P 値が 0.05 よりはるかに小さく、R-2 乗値は 1 に近いからです (詳しくはオンラインヘルプをご覧ください)。言い換えれば、データポイントの大半は見出した傾向線に非常に近く、このモデルはデータによく合っているということです。特にアジア太平洋の観光支出額は、他の地域より増加の度合いが速いように見受けられます。
高度な分析テクニック:
ここでは、 トレンド分析を行いました。トレンド分析では、同一の値を経時的に比較し、関連する変数の間にある関係を特定することができます。また、地域別の市場データとの クロスデータベース結合 も行いました。クロスデータベース結合とは、より完全な分析を行うために、複数のデータセットのデータを統合する機能です。
すると、次に知りたいことは...
タイは今後、アジア太平洋の成長に対して具体的にどのように寄与する可能性があるでしょうか?
行う作業
世界の観光支出額に対して高まるアジア太平洋の影響に、タイがどれほど寄与しているかを調べましょう。タイを訪れた観光客は 2013 年に約 470 億ドルを費やしましたが、2014 年にはわずか 420 億ドルになっています。Tableau で R モデルを作成し、2013 年の観光収入額を超えるのに必要な観光客数を予測してください。
得られる結果
タイが新しい収入目標を達成するには、さらに 2,900 万人の観光客が必要です。
高度な分析テクニック
予測モデリングに R 統合を、特に重回帰分析を使用しました。R は、規模の大きなデータセットに対して、高度な分析と予測分析を実行するために使用されるプログラミング言語です。R で以前に構築されたモデルは Tableau でも利用できるので、分析をさらに掘り下げることが可能です。