Tableau: Health Media Collaboratory では、どのようなことをされているか、少しお話いただけますか。
Health Media Collaboratory 副所長、Glen Szczypka 氏: データを公共のために活用する、というのが私たちのミッションです。この 10 年で、インターネットが出現し、ソーシャルメディアが登場したことで、私たちは常時画面と向き合うようになっています。
こうしたデータメッセージに常につきまとわれているような状態です。これらのメッセージによって、健康に関して好ましくない選択が行われることがあります。そこで、こうしたデータを研究し、そのデータを活かして、人々の健康に役立てたいと考えています。
Tableau: ソーシャルデータの分析に慣れていない方が、気を付けるべきことは何でしょうか。Tableau でソーシャルデータを扱う際のヒントなどはありませんか。
Szczypka 氏: まず気を付けなければならないのは、ソーシャルデータは乱雑なデータであるということです。そして、キーワードを使ったとしても、その質問がツイートに含まれるとは限らないということです。
目の前のツイートは、調査対象者の行動であることを理解しておく必要があります。ソーシャルメディアのデータは、Tableau に取り込む前に整理する必要があります。
ツイートのフロントエンドについては、利用できる情報源が約 4 つあります。しかし、ツイートのバックエンドに関しては、20 ~ 25 種類のメタデータがあり得ます。
そして、Tableau はツイートに対して威力を発揮します。緯度と経度のデータを取得すると、そのデータを Tableau で処理できます。ツイートの場所を、多数の円を使ってマップ上に表示できます。そしてツイートの裏にあるメタデータの変数をとてもうまく処理してくれます。
Tableau: どのような種類のデータを調査対象として扱っているのでしょうか。
Szczypka 氏: Tumblr、Twitter、Facebook、YouTube、WordPress と、さまざまなソーシャルメディアプラットフォームからデータを集めています。次に扱うプラットフォームは Foursquare です。Foursquare では位置情報がすべてですから、この分析は本当に楽しみにしています。ソーシャルデータを取り巻く環境は急速に変化しています。新しいプラットフォームが出てきます。私たちは、新しいものが出てくるたびに、そのデータを収集しようと努めています。
Tableau: このソーシャルデータに対して Tableau をどう使われていますか。
Szczypka 氏: CDC や国立がん研究所など多くの助成金提供者は、グラフの見方を知っています。彼らはすぐに答えが得られることを望んでいます。20 ページも 30 ページもある報告書を読む気はありません。グラフを見て、いくつかポイントの説明を受けたら理解できる。そういう報告を望んでいるのです。
CDC や国立がん研究所など多くの助成金提供者は、グラフの見方を知っています。彼らはすぐに答えが得られることを望んでいます。 20 ページも 30 ページもある報告書を読む気はありません。グラフを見て、いくつかポイントの説明を受けたら理解できる。そういう報告を望んでいるのです。
Tableau: ソーシャルデータを視覚化することで得られたインサイトについて、何か例を挙げていただくことはできますか。
Szczypka 氏: Twitter で禁煙について話している人々について分析しているのですが、1 年分を取り上げて、ヒストグラムにまとめました。そうすると、ピークがわかります。
そこで、たばこ規制に取り組む機関に、こうした人々に働きかけるならこの時期がよいのではないか、と伝えています。Twitter ユーザーの行動を分析したこのリソースを、効果的に利用してもらうことができます。
Tableau: ソーシャルデータを視覚化することで得られるメリットは何でしょうか。
Szczypka 氏: メリットは、インサイトです。グラフを見れば、インサイトが得られます。すぐに答えが得られるのです。170 万件のツイートを抽出して、ヒストグラムを作成し、週単位で表示すれば、どこにピークがあるかわかります。浮かび上がってくるのです。
私は、見た目を重要視しています。本当に大切なことだと考えています。外観だけでは無意味だということもあるかもしれませんが、データを提示する方法は本当に大切だと思います。