Health Media Collaboratory: 从社交数据获得公共卫生见解

Tableau: 您能否描述一下 Health Media Collaboratory 是做什么的?
Glen Szczypka,Health Media Collaboratory 副主任: 我们的使命是让数据为公众利益服务。 在过去十年中,随着互联网的出现、社交媒体的诞生,我们现在时刻都面对着屏幕。

这些数据信息将我们淹没。 而这些信息可能会导致我们做出非常糟糕的卫生选择。 因此,我们想研究数据,驾驭数据,将其用于改善人们的健康。

Tableau: 如果我刚开始从事社交数据分析,我应该注意什么事情? 针对如何在 Tableau 中使用社交数据,您能否提供一些技巧?
Glen: 您必须首先认识到,社交数据并非井井有序。 不能仅仅因为自己使用了关键词,就认为自己要问的问题会包含在某条推文中。

必须意识到,您查看的推文就是自己尝试研究的行为。 因此,将自己的社交数据导入 Tableau 之前,您就需要对其进行清理。

在推文的前端,您大约可以获得四种来源的信息。 但推文后端可能存在 20 至 25 种不同类型的元数据。

Tableau 可以很好地处理推文。 您可以获取经度、纬度数据。 Tableau 对这些数据的处理效果很好。 您可以将推文发布时所在的位置绘制到这些大群集圆圈中。 对于推文背后的元数据变量,这样的处理效果很好。

Tableau: 您分析的是哪种类型的数据?
Glen: 我们的数据来自多种社交媒体平台,Tumblr、Twitter、Facebook、YouTube 和 WordPress。 我们的下一个平台是 Foursquare。 地理位置对 Foursquare 至关重要,因此我们对即将使用的这一平台感到非常兴奋。 社交数据的环境瞬息万变。 新平台会上线。 一旦新平台上线,我们就会尝试从其中收集数据。

为了找出宣传活动的最佳时机,Health Media Collaboratory 分析了一整年时间内出现提及吸烟的推文。

Tableau: 您如何使用 Tableau 来处理这些社交数据?
Glen: 我们的许多资助机构,比如疾病控制中心、国家癌症研究所,都能看到图表。 他们想要快速获得答案。 他们不想阅读一份 20 页乃至 30 页的报告,他们只想看图表,查看,并通过一些简要的说明来理解图表。

“我们的许多资助机构,比如疾病控制中心、国家癌症研究所,都能看到图表。 他们想要快速获得答案。 他们不想阅读一份 20 页乃至 30 页的报告,他们只想看图表,查看,并通过一些简要的说明来理解图表。

Tableau: 您能否通过一个示例,说明社交数据的可视化可以为您提供何种见解。
Glen: 我们对在 Twitter 上谈论戒烟的人进行了分析。 我们采集了一年的数据并将其绘制成直方图。 您可以看到高峰区。

我们告诉烟草控制组织,“这可能是针对这些人进行宣传的好时机。” 通过观察 Twitter 用户的行为,他们可以有效地使用自己的资源。

Tableau: 社交数据可视化的价值何在?
Glen: 价值在于见解。 您在查看图表时获得的见解。 收集 170 万条推文,将它们按周绘制到直方图上,反映出高峰区,您马上就能有所领悟。 见解油然而生。

我很注重良好的外观。 我认为这非常重要。 在某种意义上,这可能看似徒劳,但我认为数据的呈现方式真的很重要。