ビッグデータは画像に結び付けられたコンピュータIDの感情を助けるかもしれない

TwitterやFacebookなどの人気のあるサイトやその他のチャネルは、人が考えや感情をよりよく表現するのに役立つ写真で満たされています。新しい研究では、「ビッグデータ」(従来のデータ処理アプリケーションでは処理が難しいほど大きくまたは複雑なデータセットのコレクション)を使用して、コンピューターに画像に関連付けられたコンテンツや感情を解釈することを示唆しています。

ロチェスター大学のコンピューターサイエンスの教授である‪JieboLuo博士は、Adobe Researchの研究者と共同で、American Association for Artificial Intelligence(AAAI)会議で、プログレッシブトレーニングの深い畳み込みニューラルネットワーク(CNN)について論文を発表しました。

訓練されたコンピューターを使用して、これらの画像が引き出す可能性のある感情を判断できます。ルオ氏は、この情報は経済指標の測定や選挙の予測など、さまざまなことに役立つ可能性があると述べています。

‪しかし、タスクは複雑です。コンピューターによるテキストの感情分析は、それ自体が困難な作業です。また、ソーシャルメディアでは、感情分析はより複雑です。なぜなら、多くの人々は、コンピューターが理解するのがより難しい画像やビデオを使用して自分自身を表現するためです。

たとえば、政治運動の間、有権者は写真を通じて自分の見解を共有することがよくあります。

2つの異なる写真が同じ候補者を示している可能性がありますが、非常に異なる政治的声明を出している可能性があります。人間は1つを候補者の肯定的な肖像画(たとえば、候補者が笑顔で腕を上げる)であり、もう1つを否定的なもの(たとえば、候補者が敗北している様子の写真)であると認識できます。

しかし、ソーシャルメディアで共有されているすべての画像を人間が見ることはできません。それは本当に「ビッグデータ」です。候補者の人気について情報に基づいた推測を行うには、このデータをダイジェストするようにコンピューターをトレーニングする必要があります。これは、Luoと彼の共同研究者のアプローチがこれまでよりも正確に行えることです。

研究者は、画像から感情を抽出するタスクを画像分類問題として扱います。これは、どういうわけか各画像を分析し、それにラベルを適用する必要があることを意味します。

Luトレーニングプロセスを開始するために、Luoと彼の協力者は、SentiBankと呼ばれる既存のデータベース(コロンビアのShih-Fu Chang博士のグループによって開発された)で、特定の感情を持つマシンアルゴリズムによって大まかにラベル付けされた多数のFlickr画像を使用しました大学)。

これは、いくつかの画像が何を伝えることができるかを理解するための開始点をコンピューターに与えます。

しかし、機械で生成されたラベルには、そのラベルが真である可能性も含まれています。つまり、コンピューターはラベルが正しいことをどの程度確信していますか?

次に、トレーニングプロセスの重要なステップとして、ラベル付けされた感情が正しくない可能性のある画像を破棄します。そのため、強力な畳み込みニューラルネットワークのフレームワーク内で段階的に改善する方法でさらにトレーニングするために、「より良い」ラベル付けされた画像のみを使用します。

Resaercherは、この追加の手順により、各画像にラベルが付けられる感情の精度が大幅に向上することを発見しました。

また、Twitterから抽出されたいくつかの画像を使用して、この感情分析エンジンを適合させました。この場合、彼らは「クラウドインテリジェンス」を採用し、Amazon Mechanical Turkプラットフォームを介して複数の人々が画像の分類を支援しました。

彼らはコンピューターを微調整するために少数の画像のみを使用しましたが、このドメイン適応プロセスを適用することにより、Twitter画像の感情分析の最新の手法を改善できることを示しました。

驚くべき発見の1つは、画像の感情分類の精度が、同じTwitterメッセージのテキストの感情分類の精度を超えていることです。

出典:ロチェスター大学

!-- GDPR -->