開発中:気分を評価できるスマートフォン

ロチェスター大学の研究者たちは、スマートフォン用のプロトタイプアプリがすでに作成されている、音声を通じて人間の感情を測定する新しいコンピュータープログラムを開発しています。

このプログラムは、人が言っていることを分析するのではなく、方法を分析します。

「私たちは実際に、月の日付を読み上げる俳優の録音を使用しました。彼らが何を言っているかは本当に重要ではありません。私たちが興味を持っていることを彼らがどのように言っているかです」と、ウェンディハインツェルマン博士は語った。電気およびコンピュータ工学の。

プログラムは、ピッチや音量などの12の音声機能を分析して、サウンドレコーディングから6つの感情の1つを識別します。研究者達はそれが81パーセントの正確さを達成したと言います、これは約55パーセントの正確さしか達成しなかった以前の研究の大幅な改善です。

この調査は、ユーザーの声を録音して分析した後、幸せそうな顔と悲しい顔のどちらかを表示するアプリのプロトタイプの開発にすでに使用されています。これは、Microsoft Researchでの夏のインターンシップ中に、ハインツェルマンの大学院生の1人であるNa Yangによって建てられました。

「研究はまだ始まったばかりです」とハインツェルマンは認めました。「しかし、モバイル(電話)に表示される色の調整から音楽の再生まで、このテクノロジーを使用してより複雑なアプリを想像するのは簡単です。 「あなたの声を録音した後に感じています。」

ハインツェルマンと彼女のチームはロチェスターの心理学者博士と協力しています。 Melissa Sturge-AppleとPatrick Daviesは、現在10代の若者とその親の相互作用を研究しています。 「感情を分類する信頼できる方法は、私たちの研究に非常に役立つかもしれません」とスタージアップルは言った。 「それは、研究者が会話を聞いて、さまざまな段階でさまざまな人々の感情を手動で入力する必要がないことを意味します。」

研究者によると、感情を理解するためにコンピュータを教えることは、人間がそれをどのように行うかを認識することから始まります。

「誰かが話しているのを聞いて、「ああ、彼は怒っているように聞こえる」と思うかもしれません。しかし、あなたはそれをどう思いますか?」スタージアップルは言った。

彼女は感情が彼らのスピーチのボリューム、ピッチそしてハーモニクスさえ変えることによって人々が話す方法に影響を与えると説明しました。 「私たちはこれらの機能に個別に注意を払うのではなく、怒りがどのように聞こえるかを知るようになったばかりです-特に私たちが知っている人々にとって」と彼女は付け加えました。

しかし、コンピューターが感情を分類するには、測定可能な量で動作する必要があります。そのため、研究者らは、短い間隔で各録音で測定された12の特定の音声機能を確立しました。その後、研究者はそれぞれの録音を分類し、それらを使用してコンピュータープログラムに「悲しい」、「幸せな」、「恐ろしい」、「うんざりした」、または「中立的な」音を教えました。

次に、システムは新しい録音を分析し、録音内の音声が既知の感情を表現しているかどうかを判断しようとしました。コンピュータプログラムが2つ以上の感情を決定できなかった場合、その録音は分類されませんでした。

「録音された音声が特定の感情を反映しているとコンピューターが考えるとき、私たちは自信を持っていると思います」とハインツェルマンは言った。

以前の研究では、感情分類システムは話者に大きく依存していることを示しています。つまり、システムが分析するのと同じ声で訓練された場合、システムははるかにうまく機能します。 「これは、私たちと一緒に働く親やティーンエイジャーのように、話したり話したりしている人々のグループで実験を実行できるようにしたい状況には理想的ではありません」とスタージアップルは言った。

新しい結果はこの発見を裏付けています。音声ベースの感情分類が、システムをトレーニングしたものとは異なる音声で使用される場合、精度は81%から約30%に低下しました。研究者たちは現在、同じ年齢層、同じ性別の声でシステムをトレーニングすることにより、この影響を最小限に抑える方法を検討しています。

「このシステムを実際の状況に似た環境で使用したい場合、解決すべき課題がまだありますが、私たちが開発したアルゴリズムは以前の試みよりも効果的であることは確かです」とハインツェルマン氏は語った。

出典:ロチェスター大学

!-- GDPR -->