「思ったよりも凄すぎ」堀江氏も感動!Pixel6の文字起こし機能の“ミソ”とは

写真拡大 (全3枚)

堀江貴文氏がTwitterを更新。Google Pixel6での文字起こし機能の性能の良さに驚きの声を上げました。

「pixel6の文字起こしが思ったよりも凄すぎて」とコメントしながら、リアルタイムで文字起こしをしている様子を動画で紹介しています。

動画では、堀江氏が実際にPixel6で音声を文字に起こす様子が映されており、「ほぼ95%以上の認識率ですね」と堀江氏が述べるように、誤認識はほとんど見られません。この驚くべき認識率の高さは、どう実現されているのでしょうか。

Googleが独自開発した「Google Tensor」

画像:achinthamb/Shutterstock

この堀江氏のツイートに対する「Androidよく知らないのだけど、これはOSの機能で他の端末でもいけるの?それともピクセル独自ソフト?」という他ユーザーからの質問に、堀江氏は「Pixel6に搭載されてるGoogle TensorというSoCがミソ。エッジコンピューティング的にハードウェアで高速にディープラーニングできるようになってるから実現してるこれ」と回答しました。

この「Google Tensor」は、Pixel6の販売元であるGoogleが独自開発したチップです。マイナビニュースの報道(※1)によると「機械学習によるAI機能を重視し、スマートフォン単独で機能を実現することを目的」とされているとのこと。

以前堀江氏が自身のYouTubeチャンネルで触れていたように(※2)、日本語は「膠着語」であるため認識が難しいとされています。英語の場合には単語が空白で区切られていますが、日本語は単語がくっついた状態で書かれるため、機械的に読み取るのが難しいのです。

この課題を乗り越えた高い認識率には、今回のGoogle Tensorをはじめとする技術の進歩が寄与しているのでしょう。

iPhoneシェアに切り込めるか

画像:siro46/Shutterstock

このようにPixel6は前モデルよりも性能がかなり向上しているため、リアルタイムでのスムーズな文字起こしが可能となったようです。複数人での会話も問題なく文字起こしできるようで、これからビジネスで応用できる場面も十分にあると思われます。

さらに報道(※1)によると「メッセージのリアルタイム翻訳機能、Googleアシスタントの通訳機能、レコーダーアプリの文字起こし機能、カメラの各種機能がスマートフォン単体で動作」しており、「ネットワークアクセスがなくても、難しい翻訳や文字起こしができ、しかも日本語に対応した状態で動作する」と、様々な機能の紹介が。

日本ではiPhoneに比べて、Androidスマートフォンの方が普及率が低い傾向がみられますが、このような独自の機能によって変化が生じるかもしれませんね。