どのツイートが信頼できるかを把握する方法

ジョージア工科大学の研究者たちは、Twitterで報告された世界の出来事の信頼性にどの単語やフレーズがプラスまたはマイナスの影響を与えるかを示す新しい言語モデルを開発しました。

約1,400の実世界のイベントに関する6,600万のツイートをスキャンしたこの調査は、ソーシャルメディア上の何百万もの人々の言葉が、イベントがまだ進行中であっても、イベントの信頼性に関するかなりの情報を提供する可能性があることを示唆しています。

ジョージア工科大学博士号を取得したタヌシュリーミトラは、次のように語っています。研究を主導した候補者。

チームは、西アフリカでのエボラの出現、パリでのチャーリーヘブド攻撃、ニューヨーク市でのエリックガーナーの死など、2014年と2015年の世界の出来事に関するツイートを調査しました。

研究者たちは人々に投稿を自分の信頼性について判断するように求めました(「かなり正確」から「かなり不正確」まで)。次に、チームは単語をモデルに送り、15の異なる言語カテゴリに分類しました。分類には、肯定的感情と否定的感情、ヘッジとブースター、および不安が含まれていました。

その後、ジョージア工科大学のコンピューターは単語を調べて、ツイートが信頼できるものかどうかを判断しました。人間の意見と一致した時間は約68%で、ランダムなベースラインの25%よりも大幅に高い割合でした。

「「否定できない」などのブースターワードや「熱心」や「すごい」などのポジティブな感情の言葉を使ったツイートは、非常に信頼できると見なされていました」とMitra氏は述べています。 「肯定的な感情を示しているが、「は」、「にやにや」、「冗談」など、出来事の非現実性をあざける言葉は信頼性が低いと見なされていました。 「特定のレベル」や「容疑者」などのヘッジワードもそうでした。」

リツイート数が多いほど、信頼性スコアは低くなりました。メッセージの長さが長い返信とリツイートは、信頼性が高いと考えられていました。

「メッセージの長さが長いほど、より多くの情報または推論が提供される可能性があるため、それらはより信頼できると見なされます」と彼女は言った。 「一方、信頼度が低いと評価されたリツイート数が多いほど、危機や不確実なときに集団的な推論を引き出そうとする試みを表す可能性があります。」

モデルはまだ展開可能ではありませんが、ソーシャルメディアで展開されるイベントの信頼性を計算できるアプリを開発する可能性があると研究者たちは述べています。

「イベントのトピックや構造情報などの他のシグナルと組み合わせると、私たちの言語的結果は自動化システムの重要なビルディングブロックになる可能性があります」と、ジョージア工科大学のインタラクティブコンピューティングスクールの助教授であり助教を務めるエリックギルバート博士は述べています。

「ツイッターは、偽りのニュースをオンラインで広める問題の一部です。しかし、それはソリューションの一部にもなり得ます。」

出典:ジョージア工科大学

!-- GDPR -->