iPhoneの人工知能音声アシスタントとして親しまれているSiriは、21もの言語で利用可能となっており、ライバルたちに大きく差をつけています。語学堪能なSiriを育てたのは、Apple独自の手法です。

音声アシスタントの利用可能言語数、Siriが圧勝

スマートフォンの音声アシスタントの先駆者であるSiriは、世界36か国用に最適化された21言語を理解することができます。これは、MicrosoftのCortanaが13か国の8言語、Google Assistantが4言語、AmazonのAlexaが英語とドイツ語の2言語に限られるのと比べると、圧倒的な差と言えます。
 
Siriは、さらに中国・上海周辺で使われる上海語も修得しようとしています。
 
世界のスマートフォン販売台数の中心は、アメリカなどの英語圏以外であることを考えると、この差は端末の販売にも影響してきます。

Apple独自の手法でSiriをトレーニング

同じ英語でも、アメリカ、イギリス、オーストラリアのそれぞれに特徴的な発音や表現があり、人工知能アシスタントにとって、自然な言語を理解し、話すのは容易ではありません。
 
AppleでSiri研究チームの上級技術者をつとめるアレックス・アセロ氏が、Siriに新しい言語を覚えさせる手法をReutersに明かしています。
 

アレックス・アセロ氏

アレックス・アセロ氏


 
まず、何人かがその地域の訛りや発音の特徴を含めて文章を音読し、特徴を含めて文字起こしすることで、コンピュータは話し言葉と文字の正確な対応関係を学びます。
 
AppleはSiriに新しい言語を習得させるのに、「ディクテーション・モード」と呼ばれる、文字と話し言葉の変換システムを用います。ユーザーが話す音声の数パーセントを録音し、背後のノイズやはっきり聞き取れない言葉を人間が解読して文字化し、認識精度を高めていきます。
 
その後、声優がSiriの声を録音することで、その言語版のSiriが完成します。
 
また、新言語版のSiriが公開され、多くの一般ユーザーがSiriを使えば、匿名化された音声データを広く集め、さらに認識精度を高めることができます。こうしてSiriは、実世界で話されている言葉を学び、修得していきます。

iPhoneの操作だけでなく、モノマネも得意なSiri

AirPodsは、Siriで音声操作することで、非常に便利に使えます
 
Siriは、ドラムプレイに合わせて正確なリズムを刻むこともできるほか、話題のお笑い芸人のモノマネもできます。

 
 
Source:Reuters
Photo:linkedin
(hato)