Facebook上の感情的な伝染?より悪い研究方法のような
何かを示す研究(Kramer et al。、2014)が最近発表されました 驚くべき — Facebookのステータスアップデートで表明されているように、人々は他の人々のポジティブ(およびネガティブ)気分の有無に基づいて感情や気分を変えました。研究者たちは、Facebookのニュースフィードでの友人の言葉が私たち自身の気分に直接影響を与えたと示すために、この影響を「感情的な伝染」と呼んでいました。研究者が実際に誰かの気分を測定したことは決してないことに注意してください。
そして、研究には致命的な欠陥があることを気にしないでください。他の研究も見落としている1つ-これらすべての研究者の発見を少し疑わしいものにします。
これらの種類の研究で使用されているとんでもない言語(実際、感情は「伝染病」のように広がっていますか?)を脇に置いて、これらの種類の研究はしばしば 言語分析 ほんの少しのテキスト。 Twitterでは、それらは非常に小さく、140文字未満です。 Facebookステータスの更新がまれに数文以上になることはほとんどありません。研究者は実際に誰かの気分を測定しません。
では、特に689,003のステータスの更新について、このような言語分析をどのように実行しますか?多くの研究者は、このために自動化されたツール、つまり言語探求および単語カウントアプリケーション(LIWC 2007)に目を向けています。このソフトウェアアプリケーションは、作成者によって次のように説明されています。
最初のLIWCアプリケーションは、言語と開示の探索的研究の一環として開発されました(Francis、1993; Pennebaker、1993)。以下で説明するように、2番目のバージョンLIWC2007は、元のアプリケーションの更新されたリビジョンです。
それらの日付に注意してください。ソーシャルネットワークが設立されるずっと前に、LIWCは、本、記事、科学論文、実験条件で書かれたエッセイ、ブログエントリ、またはセラピーセッションの筆記録など、大量のテキストを分析するために作成されました。これらすべての共通点の1つに注意してください。これらは長さが適切で、最低400ワードです。
なぜ研究者は、短いテキストスニペット用に設計されていないツールを使用して、まあ…テキストの短いスニペットを分析するのですか?残念なことに、これは大量のテキストをかなり速く処理できる数少ないツールの1つだからです。
誰がテキストがどれくらい長く測定することに関心があるか?
このツールで分析しようとしているテキストの長さがなぜ重要なのか疑問に思って、そこに座っているかもしれません。 1文、140文字、140ページ…長さが問題になるのはなぜですか。
このツールは実際には、TwitterやFacebookの研究者が取り組んだ方法でテキストを分析するのがあまり得意ではないため、長さが重要です。テキストの肯定的または否定的な感情を分析するように依頼すると、調査中のテキスト内の否定的および肯定的な単語が数えられます。記事、エッセイ、ブログのエントリの場合、これは問題ありません。ほとんどの記事は400ワードまたは500ワードを超えるため、記事の全体的な分析がかなり正確になります。
ただし、ツイートやステータスの更新の場合、これは恐ろしい分析ツールです。それは差別化するように設計されていなかったためです-そして実際、 できない 区別—文中の否定語。1
これが重要である理由の2つの仮説例を見てみましょう。以下は、珍しいことではない2つのサンプルツイート(またはステータスの更新)です。
- "私は幸せではない。"
「私は素晴らしい日を過ごしていません。」
独立した評価者または裁判官は、これら2つのツイートを否定的なものとして評価します。彼らは否定的な感情を明確に表しています。マイナスのスケールでは+2、プラスのスケールでは0になります。
しかし、LIWC 2007ツールはそのように認識していません。代わりに、これらの2つのつぶやきの評価は、肯定的な場合は+2(「素晴らしい」と「幸せ」という単語のため)、否定的な場合は+2(両方のテキストで「ない」という単語による)と評価されます。
公平で正確なデータの収集と分析に関心がある場合、これは大きな違いです。
また、人間のコミュニケーションの多くにはこのような微妙な要素が含まれているため、皮肉、否定の単語、前の文を否定するフレーズ、絵文字などとして機能する省略形の省略形さえも含まれていないため、正確さや不正確さを知ることすらできません。これらの研究者による結果の分析です。 LIWC 2007は非公式な人間コミュニケーションのこれらの微妙な現実を無視しているため、 研究者もそうです.2
多分それは、研究者が問題が実際にどれほどひどいかわからないからだ。なぜなら、分析エンジンの欠陥を実際に理解せずに、この「ビッグデータ」すべてを言語分析エンジンに送信しているだけだからです。否定語を含むツイート全体の10%ですか?または50%ですか?研究者はあなたに言うことができませんでした。3
真実であっても、研究は小さな現実世界の影響を示しています
このため、この方法論上の大きな問題にもかかわらず、この研究を額面どおりに信じたとしても、一般ユーザーにはほとんどまたはまったく意味のない、途方もなく小さい相関関係を示す研究が残っていると私は言わざるを得ません。
例えば、クレイマー等。 (2014)は0.07%を発見しました—これは7%ではなく、1%の15分の1です!! — Facebookニュースフィードへの否定的な投稿の数が減少したときに、人々のステータスの更新で否定的な単語が減少します。この影響によりネガティブな単語を1つ書く前に、いくつの単語を読み書きする必要があるか知っていますか。おそらく数千。
これは、実際の意味を持たない統計的なメッセージほどの「効果」ではありません。研究者自身も同様に認めており、効果の大きさは「小さい( d = 0.001)。」同じ研究者による政治的投票の動機に関するFacebookの調査と心理学ジャーナルからの22歳の議論を引用して、「小さな影響は大きな結果をもたらす可能性がある」ため、彼らはさらにそれが重要であることを示唆し続けています。
しかし、彼らは以前の文で矛盾しており、感情は「気分に影響を与える日常のさまざまな経験を考えると影響を与えるのは難しい」と示唆しています。どっち? Facebookのステータスの更新は個人の感情に大きな影響を与えていますか、それとも他の人のステータスの更新を読むだけでは感情はそれほど簡単には影響を受けませんか?
これらすべての問題と制限にもかかわらず、いずれも研究者が最終的に宣言することを止めるものではありません。繰り返しになりますが、彼らが実際に一人の感情や気分状態を測定したのではなく、その代わりに欠陥のある評価測定に頼っていました。
私の意見では、Facebookの研究者が明確に示しているのは、ツールの重大な制限を理解および議論せずに、彼らが使用しているツールに過度の信頼を置いているということです6。
参照
クレイマー、ADI、ギロリー、JE、ハンコック、JT。 (2014)。ソーシャルネットワークを介した大規模な感情的伝染の実験的証拠。 PNAS。 www.pnas.org/cgi/doi/10.1073/pnas.1320040111
脚注:
- これはLIWCの開発者への問い合わせによると、「LIWCは現在、スコアリングの肯定的または否定的な感情用語の単語の近くに否定用語があるかどうかを見ていません。そのため、効果的なアルゴリズムを考案することは困難です。とにかくこれ。」 [↩]
- 本研究や私が調査した他の研究でLIWCが設計または意図されていない目的のための言語分析ツールとしてのLIWCの使用の制限について言及することはできませんでした。 [↩]
- まあ、彼らは実際に人々の実際の気分を測定することと比較するためにパイロット研究で彼らの方法を検証する時間を費やしたかどうかを教えてくれるでしょう。しかし、これらの研究者たちはこれに失敗しました。 [↩]
- Facebookの投票調査にはいくつかの深刻な問題があり、そのうちの少なくとも1つは、投票行動の変化が1つの相関変数に起因するものであり、研究者が行った仮定の長いリストが含まれています(同意する必要があります)。 [↩]
- 著者による説明とコメントの要求は返されませんでした。 [↩]
- これはLIWC 2007での掘り出し物ではありません。これは、適切な目的で右手で使用する場合、優れた調査ツールになる可能性があります。 [↩]