by Jason Bolonski

ネガティブな内容をポジティブな言い方で間接的に伝える皮肉(Sarcasm)は、古代ギリシャ語の「sarkasmós(肉を歯でひきちぎる)」というあざけりや侮辱を意味する動作に由来していて、古来から人間が使うレトリックです。言葉通りの意味とは別にある書き手や話し手の本当の気持ちは、文脈や感情を理解できないコンピューターでは読み取ることができないとされてきました。しかし大量のテキストデータをディープラーニングによって分析し、言葉と意味の関係性から文章に埋め込まれた皮肉をコンピューターに見極めさせる研究が行われているとのことです。

Snark Bite: Like an AI Could Ever Spot Sarcasm | NVIDIA Blog

https://blogs.nvidia.com/blog/2018/01/31/ai-detect-sarcasm/

インド工科大学パトナー校の学長で、ボンベイ校の教授でもあるPushpak Bhattacharyyaさんは、自身の教え子や言語学者・心理学者らで構成された研究チームを率いて、ディープラーニングによってネット上の皮肉めいたコメントや悪意ある発言を検出するという研究を行っています。



Bhattacharyyaさんは「皮肉の分析研究を進めるのには妥当な理由がある」と主張します。国家の元首・政治家・セレブ・企業など、世間の評判を気にしなければならない立場の人たちは、Twitterなどのソーシャルメディアで自分の評判を逐一チェックしています。そこで用いられているのが、文章から書いた人の感情を分析する感情分析という手法です。しかし、Bhattacharyyaさんは「皮肉というものは人間の感情の動きをはっきりと示しますが、コンピューターを用いた従来の感情分析では、皮肉めいたコメントを正しく拾うことができません」と指摘します。

例えば「携帯電話のバッテリーが残りあと2時間だ。最高だね」というツイートがあったとして、コンピューターはバッテリーの寿命が残り2時間であることが「良いことではない」と判断できなければ、皮肉を検出したとはいえません。またBhattacharyyaさんの調査によると、皮肉めいたツイートのうちおよそ5分の1が「3時間もよく寝た!今日も長い一日になりそう」など「数字を含んだつぶやき」でしたが、これらも一般的な感情分析ではあまりピックアップできなかったとのこと。



本来皮肉な物言いに気付くためには、文脈を理解しなければいけません。しかしBhattacharyyaさんは「矛盾した言い回しやちぐはぐな感情表現こそが皮肉の特徴だ」という結論に至ります。例えば「私は無視されることが大好きだ」という文章だと、「大好きだ」というポジティブな言葉と「無視される」というネガティブな言葉が一致しません。Bhattacharyyaさんはこうした言葉の不一致を検出するアルゴリズムを組みます。さらにディープラーニング専用ライブラリであるCuDNNで高速化したTensorFlowのフレームワークを導入し、NVIDIAのGeForce GTX1080TiのGPUを用いたニューラルネットワークを構築します。そして、大量のツイートから映画評論、1990年代の人気コメディドラマ「フレンズ」のセリフに至るまで大量のテキストデータを用意し、ディープラーニングを用いたデータ分析を行いました。その結果、Bhattacharyyaさんが組んだアルゴリズムはこれまでの方法よりも正確に皮肉を検出できるようになり、特に数字を含むツイートについては80%という今までの3倍以上の精度で検出できたとのことです。

そしてこれまでのデータを元に、ブラウザベースで動く皮肉検索エンジン「Sarcasm Suite」や、自ら皮肉なコメントを作り出すSarcasmBotも開発。あるユーザーがSarcasmBotに「Greg Estes氏についてどう思う?」と質問したところ、SarcasmBotは「うーん、Gregのことは好きだよ。責任感が全然ない人を私は本当に高く評価しているから」と皮肉交じりに応えたとのことです。