音声認識エンジン「Hound」が見せる、「モノと対話する」未来(動画あり)

写真拡大

鼻歌でも認識できる楽曲検索サーヴィスを提供するSoundHound社が、驚くほど強力な音声アシスタント「Hound」を発表。複雑な難しい質問にも、即座に返答できる様子を動画で紹介。

「音声認識エンジン「Hound」が見せる、「モノと対話する」未来(動画あり)」の写真・リンク付きの記事はこちら

いま「SoundHound」に対する多くの人の印象は、「音楽認識サーヴィス」、だ。だが同社は、この認識を変えたいと思っている。6月2日(米国時間)、彼らは約10年をかけて取り組んできた別のプロジェクトを発表した。音声制御インターフェイスの「Hound」だ。

鼻歌から曲名を特定することもできるSoundHoundは、独自の音楽検索エンジンから得た巨大な照会データベースをもっている。そして今度は、こうした能力がさらに広範囲のトピックやアクションに適用されることになるのだ。

Houndを使うことで人々は、電話やタブレットはもちろん、クルマ、さらにはトースターやエスプレッソマシンとさえも対話できるようになると、SoundHound社は期待している。

関連記事Facebook、買収した「音声認識技術」で狙うものは

Houndは「Siri」のような感じで、メッセージを送信したりアラームを設定したり、道順を調べたりすることができる。だが、もっと難しくて複雑なことにも対応するようにつくられている。例えば「いまから3週間先の木曜日に、フィッシャーマンズワーフの近くで200ドル未満で泊まれるホテル。プールと無料Wi-Fiが必要」と話せば、Houndは即座に言われたデータを解析して、要求にぴったりのものを見つけてくれるという。

SoundHound社の創立者であるキーヴァン・モハジェは、Houndのデモンストレーションのなかで、自分の「Nexus 5」に対して、外国の場所に関するさらに複雑な命令と質問を話しかけた。Houndは、3カ国の人口と首都をすぐさま返答。処理時間を一切必要とせず、モハジェが知りたかったことを伝えたのだ。

「Houndの限界は、(長い複雑な文章を語るにあたって)ユーザーの息が続くかだけだ」とモハジェは語る。以下の動画では、ほかにもさまざまなやりとりを見ることができる。

ほとんどの音声認識システムでは、ユーザーの入力を収集、合成、送信、処理という順序で動作するが、Houndは、これらのことをすべて同時に行う。つまりこれは、音声で検索と再検索を行うGoogleの「Instant Search」のようなものだ。Siriと交わす終りのない堂々巡りに比べると、かなり快適といえるだろう。

開発者たちは、「Houndify」システムを利用することで、自分たちのアプリにHoundの技術と音声制御を統合することができる。また、自分たちのデータとAPIを、Houndのインターフェイスに埋め込むこともできる。

SoundHound社はまずは、旅行サイトのエクスペディア社と提携するが、パートナーの数を増やしていきたいと考えている。モハジェは特にレシピに関心があり、「オーケイHound、いまここに、セロリとチキンスープとソーセージがある」と話しかけると、これらを使ったレシピが即座に返ってくるようにしたいと話している。

Houndは、現在はAndroid向けのプライヴェート・ベータ版のみの提供だが、iOS版も近いうちに発売される予定だという。

Houndは、Siriや、マイクロソフトの「Cortana」、「Google Now」が待ち構える、ますます混雑する市場へと参入することになる。さらに、「Viv」や「Dragon Mobile Assistant」など、電話に話しかけるだけで機能を実行できる方法はほかにもたくさんある。

TAG

AssistantAppSoundHoundVideoWIRED US