Facebookプロフィールは性格を測定できますか?

これは、ペンシルベニア大学の学際的な研究者グループが回答しようとしている質問です。現在、心理学者は性格を評価するために自己報告の調査およびアンケートを含むさまざまな方法を使用しています。
最近の調査では、75,000人がFacebookアプリケーションを通じて自発的に共通の性格アンケートに回答し、Facebookのステータス更新を調査目的で利用できるようにしました。次に、研究者はボランティアの言語の全体的な言語パターンを探しました。
研究はジャーナルに掲載されています PLOS ONE.
調査員は、個人の年齢、性別、および性格に関するアンケートでの回答を予測できるコンピュータモデルを生成しました。
これらの予測モデルは驚くほど正確でした。たとえば、最新のステータスの言語だけに基づいてユーザーの性別を予測した場合、研究者は92%の確率で正しかった。
この「オープン」アプローチの成功は、性格特性と行動の関係を調査し、心理的介入の有効性を測定する新しい方法を示唆しています。
研究者の研究は、人々が感情や精神状態を理解する方法として使用する単語を研究してきた長い歴史を利用していますが、データの核となる分析には「閉じた」アプローチではなく「開いた」アプローチを採用しました。
「「閉じた語彙」アプローチで」ポスドク研究員のマーガレット・カーン博士は、「心理学者は、「満足」、「熱狂的」、「素晴らしい」など、ポジティブな感情を示すと思う単語のリストを選ぶかもしれません。その人がどれほど幸せかを測定する方法として、人がこれらの単語を使用する頻度を見てください。
ただし、クローズドボキャブラリーアプローチにはいくつかの制限があります。たとえば、測定しようとしているものを常に測定するとは限りません。」
「たとえば、Ungar氏は次のように述べています。「単に「粗末」という言葉を使っているからといって、エネルギー部門がより否定的な感情の言葉を使っていることに気付く人もいるでしょう。しかし、これは、意図された意味を理解するために複数の単語の表現を使用する必要があることを示しています。
「原油」は「原油」とは異なり、同様に「病気」であることは単に「病気」であることとは異なります。」
クローズドボキャブラリアプローチのもう1つの固有の制限は、先入観のある固定された単語のセットに依存していることです。そのような研究は、うつ病の人々が実際に期待される言葉(「悲しい」など)を実際に使用しているが、新しい洞察を生み出すことができないことを確認できるかもしれません(たとえば、彼らは幸せな人々よりもスポーツや社会活動について話しません)。
過去の心理的言語研究では、サンプル数が少ないためにオープンアプローチが実用的でなかったため、必然的にクローズドボキャブラリーアプローチに依存してきました。ソーシャルメディアによって提供される大規模な言語データセットの出現により、定性的に異なる分析が可能になりました。
「ほとんどの単語はめったに発生しません— Facebookのステータスの更新を含む書き込みのサンプルには、平均的な語彙のごく一部しか含まれていません」と、コンピューターおよび情報科学の博士研究員であるH. Andrew Schwartzは報告します。
「これは、最も一般的な言葉を除いて、心理的特性と関係を築くために、多くの人々からのサンプルを書く必要があることを意味します。従来の研究では、「ポジティブな感情」や「機能する言葉」など、事前に選択された言葉のカテゴリとの興味深いつながりが見つかりました。
ただし、ソーシャルメディアで利用可能な数十億の単語インスタンスにより、はるかに豊富なレベルでパターンを見つけることができます。」
対照的に、オープンボキャブラリーアプローチは、サンプル自体から重要な単語やフレーズを導き出します。この調査のFacebookステータスメッセージのサンプルから7億以上の単語、フレーズ、トピックを掘り下げたため、何百もの一般的な単語とフレーズを掘り下げ、特定の特性とより有意義に相関するオープンエンドの言語を見つけるのに十分なデータがありました。
この大きなデータサイズは、差別化言語分析(DLA)として知られる、チームが使用した特定の手法にとって重要でした。
研究者はDLAを使用して、ボランティアのアンケートで自己申告したさまざまな特性(年齢、性別、「ビッグファイブ」の性格特性のスコア-外向性、順応性、良心性、神経症、開放性)に関連する単語やフレーズを分離しました。
ビッグファイブモデルは、性格特性を定量化する一般的かつよく研究された方法であるために選択されましたが、研究者の方法は、うつ病や幸福などの他の特性を測定するモデルに適用できます。
結果を視覚化するために、研究者は特定の特性を統計的に予測する言語を要約した単語の雲を作成し、特定のクラスター内の単語の相関強度をそのサイズで表しました。たとえば、外向的な人が使用する言語を示すワードクラウドには、「パーティー」、「素晴らしい夜」、「ヒットミーアップ」などの単語やフレーズが目立ちます。一方、内向的な人のためのワードクラウドには、日本のメディアや顔文字への多くの言及があります。
「超外向的な人がパーティーについて多く話すことは明らかだと思われるかもしれません」とアイヒシュタットは言いました。「これらすべてを総合すると、これらの単語の雲は、特定の特性を持つ人々の心理的な世界に前例のない窓を提供します。多くのことは事実の後に明白になり、各項目は理にかなっていますが、それらすべて、またはそれらのほとんどでさえ考えましたか?」
プログラムディレクターのマーティンセリグマンは、次のように説明します。「外向性の人とはどのような人なのかと自問すると、「10代の少女になるのはどのような人ですか?」「統合失調症や神経症になるのはどのような人ですか?」 70歳?」これらの単語の雲は、存在するすべてのアンケートよりも、問題の核心に非常に近くなります。」
研究者は、オープンボキャブラリーアプローチを通じて人々の特性をどれだけ正確に捉えているかをテストするために、ボランティアを2つのグループに分け、一方のグループから収集した統計モデルを使用して他方の特性を推測できるかどうかを確認しました。ボランティアの4分の3について、研究者は機械学習技術を使用して、アンケートの回答を予測する単語やフレーズのモデルを作成しました。
次に、このモデルを使用して、Facebookの投稿に基づいて、残りの四半期の年齢、性別、性格を予測しました。
「言語の使い方からボランティアの性別を予測する際のモデルの精度は92%でした」とSchwartz氏は言います。「3年以内に人の年齢を半分以上予測できました。
「私たちの性格予測は本質的に正確ではありませんが、ある日からの個人のアンケート結果を使用して、別の日に同じアンケートへの回答を予測するのとほぼ同じくらい優れています。」
オープンボキャブラリーアプローチはクローズドアプローチと同等かそれ以上に予測的であることが示されているため、研究者は単語クラウドを使用して、単語と特性間の関係に関する新しい洞察を生成しました。たとえば、神経症スケールでスコアが低い参加者(つまり、最も感情的に安定している参加者)は、「スノーボード」、「ミーティング」、「バスケットボール」などの積極的な社会的追求を指す言葉を多く使用しました。
「これはスポーツをすることで神経症が少なくなることを保証するものではありません。神経症のせいで人々がスポーツを避けているのかもしれない」とウンガー氏は語った。 「しかし、それは私たちが神経症の個人がより多くのスポーツをした場合に感情的に安定する可能性を探究する必要があることを示唆しています。」
ソーシャルメディアの言語に基づいて性格の予測モデルを構築することで、研究者はそのような質問に、より簡単にアプローチできるようになりました。何百万人もの人々に調査への記入を依頼する代わりに、匿名の調査のためにボランティアにFacebookまたはTwitterのフィードを送信させることにより、将来の調査が行われる可能性があります。
「研究者は何十年にもわたってこれらの性格特性を理論的に研究してきた」とアイヒシュタット氏は述べた。「しかし、今では彼らはFacebookの時代の現代生活をどのように形作るかについて簡単な窓を持っています。」
出典:ペンシルベニア大学