Googleは2024年5月に「Search Generative Experience(SGE)」と呼ばれる、AIによる検索結果の概要を表示する機能を発表しています。Google検索へさらにAIを組み込む計画として、音声形式でAIと「会話」して検索する方式をGoogleがテスト中だと報じられています。

Google is testing a real-time voice-to-search feature | Mashable

https://mashable.com/article/google-voice-to-search-testing



Google's testing a conversational search feature that updates results in real time | Android Central

https://www.androidcentral.com/apps-software/googles-testing-a-conversational-search-feature-that-updates-results-in-real-time

検索結果から概要を示してくれるSGEやリアルタイムAI検索エンジンのPerplexityのほか、Metaが独自のAI搭載検索エンジンを開発中と報じられたり、2024年11月にはOpenAIがAI検索サービス「ChatGPT search」を発表したりと、AIの急速な進歩により検索エンジンにも生成AIが関与しつつあります。AI搭載検索エンジンは従来のウェブ検索のように検索クエリを含むページ一覧を表示するのではなく、クエリに応じた回答をウェブ検索結果からAIで要約して表示するため、OpenAIは「ウェブ上で質の高い情報を得るには何度も検索を繰り返す必要があります。しかし、ChatGPT searchならより良い回答を得ることができます」と優位性をアピールしています。

OpenAIがAI検索サービス「ChatGPT search」を発表、何度もググる必要がなくなるとアピール - GIGAZINE



検索エンジンと生成AIを複合させる最新の動きとして、Googleが「リアルタイム会話型音声検索機能」をテスト中だと報じられました。Google Chromeなどの検索エンジンでは「音声検索」することが可能ですが、音声検索は検索クエリを声に出して音声入力することができるというものです。新しい形式ではそれとは異なり、「会話」の形式で検索結果を掘り下げていくように検索していくことができます。

Android開発者のAssembleDebug氏が公開したムービーでは、実際に会話検索を行う様子を見ることができます。



会話検索を起動すると、「Listening…」と画面が音声入力を受け付けるモードになります。



AssembleDebug氏は「where is Taj Mahal(タージマハルはどこにある)」と話しました。音声入力中は、以下の画像のように「話し中」のアイコンが表示されています。



すると、タージマハルの場所を説明するSGEやマップなどが検索結果として表示されます。ここまでは従来の音声入力による検索と同様ですが、注目すべきは検索クエリの右側が「音声入力中」になったままである点です。



続けてAssembleDebug氏が「who built Taj Mahal(タージマハルは誰が建てたのか)」と話しかけると、ムガル帝国第5代皇帝のシャー・ジャハーンについての情報が表示されました。



さらに、「why it was built」と指示語を用いた場合でも引き続きタージマハルに関する結果が表示されたことから、ただ音声検索を連続して実施しているのではなく、一連の会話で検索結果を掘り下げていることがわかります。



従来のGoogle音声検索機能では、1つの検索クエリの入力と検索が終わると音声入力はいったん終了し、別の質問をするためには再度マイクアイコンをタップして音声入力し直す必要がありました。Googleがテストしている新しいアップデートは、検索プロセスを開始するとAIが文脈を踏まえた会話に応じて検索結果を掘り続けてくれるという機能となっています。

会話型音声検索機能はGoogleアプリで一般公開されていないテスト中の機能で、実際にリリースされるかどうかは不明です。ただし、OpenAIやMetaなどのAI企業が音声テキスト変換を含むAIと検索エンジンの融合を推進していることから、検索エンジン最大手であるGoogleの動きには注目が集まっています。