Health Media Collaboratory: Nutzung von Social Media-Daten für Einblicke in das Gesundheitswesen

Tableau: Können Sie kurz erläutern, was die Aufgaben des Health Media Collaboratory sind?
Glen Szczypka, stellvertretender Direktor, Health Media Collaboratory: Unser Auftrag sind Daten für das Gemeinwohl. Im Laufe der letzten zehn Jahre, mit dem Aufkommen des Internets, mit dem Aufkommen der sozialen Medien, befinden wir uns mittlerweile ständig vor einem Bildschirm.

Wir werden von diesen Datenbotschaften geradezu überflutet. Und diese Botschaften können dazu führen, dass wir wirklich schlechte Entscheidungen für unsere Gesundheit treffen. Daher möchten wir diese Daten untersuchen, sie nutzbar machen und dafür einsetzen, die Gesundheit der Menschen zu verbessern.

Tableau: Was sollte ich als Einsteiger in die Analyse von Daten aus sozialen Medien beachten? Haben Sie Tipps für die Arbeit mit solchen Daten in Tableau?
Glen Szczypka: Zunächst muss man sich vor Augen führen, dass Social Media-Daten unrein sind. Nur weil man nach bestimmten Schlüsselbegriffen sucht, heißt das nicht automatisch, dass die Frage, die Sie interessiert, auch wirklich in einem Tweet vorkommt.

Man muss wissen, dass der betrachtete Tweet das Verhalten ist, das es zu untersuchen gilt. Daten aus sozialen Medien müssen also unbedingt bereinigt werden, bevor sie überhaupt in Tableau kommen.

Am Frontend von Tweets findet man etwa vier Informationsquellen. Am Backend von Tweets kann man dagegen bis zu 25 verschiedene Arten von Metadaten erheben.

Und Tableau funktioniert hervorragend mit Tweets. Man erhält Längen- und Breitengrade, die Tableau perfekt handhabt. Man kann in großen Cluster-Kreisen darstellen, woher die Tweets stammen. Das funktioniert besonders gut mit den Metadatenvariablen am anderen Ende eines Tweets.

Tableau: Welche Art von Daten betrachten Sie?
Glen Szczypka: Wir sammeln Daten aus unterschiedlichen sozialen Netzwerken wie Tumblr, Twitter, Facebook, YouTube und WordPress. Als nächste Plattform kommt Foursquare hinzu. Bei Foursquare dreht sich alles um die Ortsbestimmung, das ist für uns besonders spannend. In diesem Bereich verändern sich Social Media-Daten besonders rasant. Es entstehen neue Plattformen. Wenn diese herauskommen, versuchen wir, dort Daten zu erheben.

Health Media Collaboratory hat alle Tweets eines Jahres zum Thema Zigarettenrauchen untersucht, um die besten Beratungsmöglichkeiten zu ermitteln.

Tableau: Wie nutzen Sie Tableau für solche Social Media-Daten?
Glen Szczypka: Viele Behörden, von denen wir Fördermittel erhalten, beispielsweise die Centers for Disease Control and Prevention und das National Cancer Institute, können sich unsere Grafiken ansehen. Sie wollen schnelle Antworten. Sie benötigen keine 20 oder 30 Seiten langen Berichte, sondern einfach nur eine Grafik, die die Sachlage verständlich anhand ein paar Punkten darstellt.

Viele Behörden, von denen wir Fördermittel erhalten, beispielsweise die Centers for Disease Control and Prevention und das National Cancer Institute, können sich unsere Grafiken ansehen. Sie wollen schnelle Antworten. Sie benötigen keine 20 oder 30 Seiten langen Berichte, sondern einfach nur eine Grafik, die die Sachlage verständlich anhand ein paar Punkten darstellt.

Tableau: Können Sie uns ein Beispiel für Erkenntnisse nennen, die Sie durch die Visualisierung von Social Media-Daten gewinnen konnten?
Glen Szczypka: Momentan führen wir eine Analyse von Tweets durch, die davon handeln, mit dem Rauchen aufzuhören. Wir haben ein Histogramm für ein ganzes Jahr erstellt. Dabei erkannten wir zu bestimmten Zeitpunkten Höchstwerte.

Wir können Organisationen zur Eindämmung des Tabakkonsums also günstige Zeitpunkte für Kampagnen empfehlen Diese können durch die Beobachtung des Verhaltens von Twitter-Nutzern ihre Ressourcen wirksam einsetzen.

Tableau: Welchen Wert hat die Visualisierung von Social Media-Daten?
Glen Szczypka: Ihr Wert liegt in den Erkenntnissen, die sie ermöglichen. Und die erhält man durch die Grafiken. Man erhält sofort eine Antwort darauf, 1,7 Millionen Tweets in ein Histogramm zu packen und im Wochenvergleich Spitzenwerte zu erkennen. Die springen einem geradezu ins Auge.

Ich bin ein großer Fan von anschaulichen Darstellungen. Darauf kommt es wirklich an. Auf gewisse Weise mag das etwas eitel sein, aber es kommt wirklich auf die Art und Weise an, wie Daten präsentiert werden.