「女子高生AI りんな」の紹介サイト

 日本マイクロソフトは、スマートフォンのカメラを通し、ユーザーが見ているのと同じ風景について会話できるスマートフォン向けAI「りんな」を発表した。現在開発中で、一般公開時期は未定。コンセプト動画が公開されている。

 スマートフォン向けAI「りんな」は、AIチャットボットとして提供されてきた「りんな」に「共感視覚モデル」(Empathy Vision model)を搭載したもの。スマートフォンのカメラを「目」として、「りんな」が見たものについてリアルタイムに音声でコメントし、ユーザーと自然な会話が楽しめるとしている。

 技術的には、マイクロソフトの研究開発部門であるマイクロソフトリサーチによる最新の画像処理、自然言語処理、音声認識および音声合成技術が採用されている。「共感視覚モデル」により、AIが見た風景の認識結果を回答するのではなく、見た「感想」を述べることができ、画像認識技術に「感情と共感」を付与し、感情のこもったコメントを生成、自然な会話が可能になるという。

 また、「全二重方式」(Full duplex)を採用、電話のような自然な会話を実現するほか、「共感チャットモデル」(Empathy Chat Model)として、コミュニケーションが長く続けられるようAIが自ら考えるように設計されている。

 なお、「りんな」の音声会話機能については、すでにLINE公式アカウント上で提供されている。

「共感視覚モデル」を搭載した「りんな」のコンセプト動画