離れた所でも人の声を認識、NTTがAIで実現

写真拡大

 NTTは人工知能(AI)を活用し、離れた場所でも人の声を認識できる遠隔音声認識技術を開発した。ディープラーニング(深層学習)を用いて認識モデルを構築し、スピーカーマイクから3メートル離れた場所でも約90%の認識率を実現する。車載型や据え置き型スピーカーマイクなどの音声入力に対応する。グループ会社を通じて、今夏の製品化を目指す。

 NTTはもともと雑音環境での音声認識技術を保有しており、これに音の揺れを吸収するAIを組み合わせて新たな認識モデルを構築した。クリーンな音声にさまざまな雑音を模擬的に生成した環境下で、AIが学習し認識精度を高めた。従来技術ではマイクから1メートル離れた場所で、約90%の認識率だった。

 AIスピーカーやコネクテッドカー(つながる車)の時代に求められる車載器の音声操作での活用を想定。これらの音声認識プラットフォームに今回の技術を用いてスピーカーと連携させる。