Tableau: 현재 Health Media Collaboratory에서 어떠한 일을 맡고 계신지 간단히 설명해 주시겠습니까?
Glen Szczypka, Health Media Collaboratory의 부원장: 저희의 사명은 공익을 위해 데이터를 제공하는 것입니다. 지난 10년간 인터넷의 발달과 소셜 미디어의 등장으로 오늘날 사람들은 항상 화면을 보며 생활합니다.
넘쳐나는 데이터 메시지에 묻혀 사는데 이러한 메시지로 인해 건강과 관련하여 매우 잘못된 선택을 하기 쉽습니다. 그래서 저희는 이러한 데이터를 연구하고 활용하여 사람들의 건강을 증진하는 데 사용하고자 합니다.
Tableau: 소셜 데이터 분석의 초보자라면 어떠한 점을 유념해야 하나요? Tableau에서 소셜 데이터 분석 작업을 할 때 유용한 도움말이 있을까요?
Glen: 가장 먼저 알아두어야 할 사실은 소셜 데이터는 순수 데이터가 아니라는 사실입니다. 단지 키워드를 사용한다고 해서 지금 하려고 하는 질문이 트윗에 올라갈 것이라 가정할 수는 없습니다.
현재 읽고 있는 트윗이 바로 연구 대상이 되는 건강 관련 행동이라는 것을 알아야 합니다. 때문에 소셜 미디어 데이터는 Tableau에 입력하기 전에 반드시 순수 데이터로 만들어야 합니다.
트윗의 전단에서 약 4가지 원본의 정보를 입수한다면 그 후단에는 20~25가지 다양한 형태의 메타데이터가 존재할 수 있습니다.
Tableau는 트윗 분석에 탁월합니다. 수집되는 종적 데이터와 횡적 데이터를 Tableau로 편리하게 분석할 수 있습니다. 트윗이 게시되는 위치를 이처럼 클러스터 원으로 표시할 수도 있고 트윗 후단에 존재하는 메타데이터 변수를 효과적으로 분석할 수 있습니다.
Tableau: 어떠한 종류의 데이터를 사용하나요?
Glen: Tumblr, Twitter, Facebook, YouTube, WordPress 등 다양한 소셜 미디어 플랫폼에서 데이터를 수집합니다. 앞으로 이용해볼 플랫폼은 Foursquare입니다. Foursquare는 지오로케이션 플랫폼인데 사용해보면 매우 재미있을 것 같습니다. 소셜 데이터 환경은 나날이 급변하고 있고 새로운 플랫폼이 다양하게 출시되고 있습니다. 새로운 플랫폼이 출시될 때마다 방문하여 데이터를 수집해보곤 합니다.
Tableau: 수집된 소셜 데이터 분석에 Tableau를 어떻게 사용하십니까?
Glen: 저희에게 연구비를 지원하는 CDC, 국립 암 연구소 등의 단체에게 그래프를 보여줄 수 있습니다. 이들은 빠른 답을 원합니다. 20장, 30장씩 되는 보고서를 읽는 게 아니라, 빨리 그래프를 보고 요점을 파악하여 이해하길 원합니다.
저희에게 연구비를 지원하는 CDC, 국립 암 연구소 등의 단체에게 그래프를 보여줄 수 있습니다. 이들은 빠른 답을 원합니다. 20장, 30장씩 되는 보고서를 읽는 게 아니라, 빨리 그래프를 보고 요점을 파악하여 이해하길 원합니다.
Tableau: 소셜 데이터를 시각화하여 얻었던 통찰력의 예를 들어주시겠습니까?
Glen: 현재 Twitter 상에서 이루어지는 금연에 대한 대화들을 분석하고 있습니다. 1년에 걸쳐 데이터를 수집하여 히스토그램으로 나타내 보았습니다. 정점들이 보이시죠?
이러한 결과를 토대로 금연 관련 단체들에게 '금연에 도움이 필요한 사람들을 지원할 적절한 시기임'을 알리면, 관련 단체들은 이처럼 Twitter 사용자의 행동을 확인함으로써 리소스를 효과적으로 사용할 수 있습니다.
Tableau: 소셜 데이터 시각화에는 어떠한 가치가 있나요?
Glen: 그 가치는 바로 그래프를 통해 얻을 수 있는 통찰력입니다. 170만여 개의 트윗을 취합하여 히스토그램에 입력하여 매주 차트로 나타내어 정점을 확인할 수 있습니다. 즉각적으로 바로 확인할 수 있죠.
저는 데이터를 보여주는 방식을 매우 중요하게 생각합니다. 어떻게 생각하면 쓸데없는 노력일 수도 있겠지만, 데이터를 보여주는 방식은 중요합니다.