ツイートは多くの公衆衛生データを提供します
ソーシャルメディアの驚異的な成長により、これまでにないコミュニケーション手段が生まれました。 Twitterだけでも、何百万ものソーシャルメディアファンが140字以内でほとんど何でもコメントできます。新しい研究活動では、このデジタル形式を使用して重要な公衆衛生の傾向を追跡できるかどうかを調べました。また、ジョンズホプキンス大学の2人のコンピュータサイエンティストによると、一言のツイートは「はい」です。
博士Mark DredzeとMichael J. Paulは、2009年5月から2010年10月の間に投稿された20億の公開ツイートをコンピューターに送り、ソフトウェアを使用して、健康問題に関連する150万のメッセージを除外しました。ツィーターのIDは収集されませんでした。
「私たちの目標は、Twitterの投稿が公衆衛生情報の有用な情報源になるかどうかを確認することでした」とDredze氏は述べています。
「私たちは確かに、彼らはそうすることができると判断しました。場合によっては、ツイーターの医師でさえ知らなかったいくつかのことを学んだかもしれません。たとえば、ポスターが自宅で症状を治療するために市販薬を使っていたなどです。」
これらの健康関連のつぶやきを電子的な「山」に分類することにより、DredzeとPaulは、アレルギー、インフルエンザの症例、不眠症、癌、肥満、うつ病、痛みおよびその他の病気に関する興味深いパターンを明らかにしました。
「インフルエンザの追跡など、Twitterの投稿を使用したいくつかの狭い研究が行われています」とDredze氏は語った。 「しかし、私たちの知る限りでは、ツイートを使用して、私たちがこれほど多くの健康問題を調べたことはありません。」
DredzeとPaulは、7月18日にスペインのバルセロナで、人工知能振興協会が主催するウェブログとソーシャルメディアに関する国際会議で完全な研究を発表します。
ツイッターの投稿でさまざまな健康上の病気を見つけることに加えて、研究者たちは、「ベナドリルをポップする必要がありました…アレルギーは最悪です」などの投稿のおかげで、悪いツイーターが消費した薬の多くを記録することができました。
他のツイートでは、薬の誤用が指摘されていました。
「インフルエンザのために抗生物質を服用しているとツイートした人もいることがわかりました」とPaulは語った。 「しかし、抗生物質はウイルスであるインフルエンザには効きません。この習慣は、抗生物質耐性の問題の増大の一因となる可能性があります。したがって、これらのツイートから、深刻な医療上の誤解がそこにあることがわかりました。」
もちろん、毎日のツイートの大部分は病気とは関係ありません。単純なアプローチは、「頭痛」や「熱」などの病気に関連する単語をフィルタリングすることですが、この戦略は、「ガスの高価格は私のビジネスにとって頭痛の種です」または「ケースを取得する」などのツイートには失敗します。ビーバーフィーバー彼の新しい歌が大好きです。」
ジョンズホプキンスの研究者たちは、元のプールにある何十億ものメッセージの中から健康関連の投稿を見つけるために、彼らが考案したフィルタリングおよび分類システムを適用しました。このツールを使用すると、健康の文脈で一般的に使用される単語が含まれていても、実際には自分の健康に関連しない語句を無視するようにコンピューターを教えることができます。
無関係なツイートが削除されると、残りの結果からいくつかの驚くべき結果が得られました。
「私たちが始めたとき、人々がTwitterでアレルギーについて話しているかどうかさえ知りませんでした」とPaulは言いました。 「しかし、彼らがそうであることがわかりました。そして、私が予期していなかったことが1つありました。システムは、2つの異なるタイプのアレルギーを検出しました。嗅覚とくしゃみを引き起こすタイプと、皮膚の発疹とじんましんを引き起こすタイプです。」
健康関連のツイートのうち約20万件で、研究者はユーザーが提供した公開情報を利用して、メッセージの送信元の状態を特定することができました。これにより、アレルギーやインフルエンザの季節が国のさまざまな場所でピークになったときなど、時間と場所によっていくつかの傾向を追跡することができました。
「アレルギーの季節は温暖な州で早く始まり、後に中西部と北東部で始まったことがツイートからわかりました」とDredze氏は語った。
DredzeとPaulは、Johns Hopkinsの一部の関係者を含む公衆衛生科学者との話し合いをすでに始めています。つぶやきの将来の研究は、ポスターの医学的問題だけでなく、病気、薬物療法に関する公衆の認識についても、さらに有用なデータを明らかにできると述べています。他の健康問題。
それでも、ドレッドとポールはツイートを分析して国の気温を測ろうとすることには限界があると警告した。
1つには、ほとんどのTwitterユーザーは自分の特定の病気について2回以上コメントしなかったため、病気の継続期間と再発の追跡が困難でした。さらに、ほとんどのTwitterユーザーは若い傾向があるため、多くの高齢者が公衆衛生調査から除外されます。また、現時点では、Twitterは米国にいるユーザーによって支配されているため、他の国での研究にはあまり役立ちません。
ソーシャルメディアサイトでは、ユーザーが多くの個人情報を友人や見知らぬ人に公開することができますが、Twitterベースの調査は特定の深さにしか到達しない場合があります。
「私たちの研究では」とポールは言いました。 Twitterで共有したいものには限界があると思います。」
それにもかかわらず、Dredze氏は、Twitterの投稿を分析するのに役立つ多くの有用なデータがまだ残っていると述べています。 「私が話し合った人々は、これが本当に興味深い調査ツールだと感じた」と彼は言った、そして「彼らは彼らがTwitterから次に何を学びたいかについていくつかの素晴らしいアイデアを持っています。」
出典:ジョンズホプキンス大学