By Esther Vargas

YouTubeのムービーには自動字幕起こし機能が搭載されていて、聴覚障害を持つ人だけでなく他言語の勉強や自国語ではないムービーの視聴がしたい人たちに利用されています。この自動字幕起こし機能で字幕を付けられたムービーの数が10億本を突破したことが明らかになっています。

Official YouTube Blog: One billion captioned videos

https://youtube.googleblog.com/2017/02/one-billion-captioned-videos.html

GoogleはGoogleビデオで投稿されているムービーに字幕を付ける機能を2006年に公開し、2009年にはYouTubeに自動字幕起こし機能を追加しました。公開当初こそユーザーが満足できるレベルの機能にはなっていなかったのですが、YouTubeにとっては大きな一歩でした。

自動字幕起こし機能が実装されて約7年が経過した2017年2月、同機能を用いて字幕の付けられたムービーが10億本を突破し、1日に視聴される字幕付きムービーは約1500万本に到達。公開されてから字幕機能は精度を日々向上してきたとのことですが、精度の向上に大きく貢献しているのがGoogleの音声認識技術です。YouTubeに投稿されるムービーは政治を扱うものからネコやゲームまで多種多様な内容を含んでおり、自動で字幕を付けるのはものすごく困難。しかし、音声認識技術や機械学習のアルゴリズム、トレーニングデータの拡張、ユーザーコミュニティからのフィードバックなどにより、公開当初から比べると精度は50%向上しています。

過去には「you」と認識していたところ……



最新の字幕機能では「YouTube」と表示できるようになっています。



ただし、50%精度が向上したといっても、まだまだ実際の音声とは異なる字幕を表示することも多々あります。例えば、映画「シビル・ウォー/キャプテン・アメリカ」予告編の1シーンでは「Washington, DC」という部分が「Washington this thing」と訳されています。また、英語以外の言語の字幕付きムービーの数が少ないと感じるユーザーもいます。



YouTubeは今後も字幕の正確性を改善していくことに注力し、さらに英語、オランダ語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語の合計10カ国語に対応している言語を増やすことも計画中とのことです。