Health Media Collaboratory: ソーシャルメディアから公衆衛生のインサイトを引き出す



国立衛生研究所の助成を受け、イリノイ大学シカゴ校の管理下にある、Health Media Collaboratory では、メディアと公衆衛生のかかわりについて研究しています。このビデオでは、副所長である Glen Szczypka 氏に、Tableau を使って、数百万行のデータからどのようにして一目でわかるインサイトを取得しているかを語っていただきました。

Tableau: Health Media Collaboratory では、どのようなことをされているか、少しお話いただけますか。
Health Media Collaboratory 副所長、Glen Szczypka 氏: データを公共のために活用する、というのが私たちのミッションです。この 10 年で、インターネットが出現し、ソーシャルメディアが登場したことで、私たちは常時画面と向き合うようになっています。

こうしたデータメッセージに常につきまとわれているような状態です。これらのメッセージによって、健康に関して好ましくない選択が行われることがあります。そこで、こうしたデータを研究し、そのデータを活かして、人々の健康に役立てたいと考えています。

Tableau: ソーシャルデータの分析に慣れていない方が、気を付けるべきことは何でしょうか。Tableau でソーシャルデータを扱う際のヒントなどはありませんか。
Szczypka 氏: まず気を付けなければならないのは、ソーシャルデータは乱雑なデータであるということです。そして、キーワードを使ったとしても、その質問がツイートに含まれるとは限らないということです。

目の前のツイートは、調査対象者の行動であることを理解しておく必要があります。ソーシャルメディアのデータは、Tableau に取り込む前に整理する必要があります。

ツイートのフロントエンドについては、利用できる情報源が約 4 つあります。しかし、ツイートのバックエンドに関しては、20 ~ 25 種類のメタデータがあり得ます。

そして、Tableau はツイートに対して威力を発揮します。緯度と経度のデータを取得すると、そのデータを Tableau で処理できます。ツイートの場所を、多数の円を使ってマップ上に表示できます。そしてツイートの裏にあるメタデータの変数をとてもうまく処理してくれます。

Tableau: どのような種類のデータを調査対象として扱っているのでしょうか。
Szczypka 氏: Tumblr、Twitter、Facebook、YouTube、WordPress と、さまざまなソーシャルメディアプラットフォームからデータを集めています。次に扱うプラットフォームは Foursquare です。Foursquare では位置情報がすべてですから、この分析は本当に楽しみにしています。ソーシャルデータを取り巻く環境は急速に変化しています。新しいプラットフォームが出てきます。私たちは、新しいものが出てくるたびに、そのデータを収集しようと努めています。

Health Media Collaboratory では喫煙に言及するツイートを 1 年分分析し、公共衛生の活動にとって最善のタイミングを特定しました。

Tableau: このソーシャルデータに対して Tableau をどう使われていますか。
Szczypka 氏: CDC や国立がん研究所など多くの助成金提供者は、グラフの見方を知っています。彼らはすぐに答えが得られることを望んでいます。20 ページも 30 ページもある報告書を読む気はありません。グラフを見て、いくつかポイントの説明を受けたら理解できる。そういう報告を望んでいるのです。

CDC や国立がん研究所など多くの助成金提供者は、グラフの見方を知っています。彼らはすぐに答えが得られることを望んでいます。 20 ページも 30 ページもある報告書を読む気はありません。グラフを見て、いくつかポイントの説明を受けたら理解できる。そういう報告を望んでいるのです。

Tableau: ソーシャルデータを視覚化することで得られたインサイトについて、何か例を挙げていただくことはできますか。
Szczypka 氏: Twitter で禁煙について話している人々について分析しているのですが、1 年分を取り上げて、ヒストグラムにまとめました。そうすると、ピークがわかります。

そこで、たばこ規制に取り組む機関に、こうした人々に働きかけるならこの時期がよいのではないか、と伝えています。Twitter ユーザーの行動を分析したこのリソースを、効果的に利用してもらうことができます。

Tableau: ソーシャルデータを視覚化することで得られるメリットは何でしょうか。
Szczypka 氏: メリットは、インサイトです。グラフを見れば、インサイトが得られます。すぐに答えが得られるのです。170 万件のツイートを抽出して、ヒストグラムを作成し、週単位で表示すれば、どこにピークがあるかわかります。浮かび上がってくるのです。

私は、見た目を重要視しています。本当に大切なことだと考えています。外観だけでは無意味だということもあるかもしれませんが、データを提示する方法は本当に大切だと思います。



こちらもご覧ください