新型「Echo Show 8」(第3世代)発表、Alexaは生成AI/大規模言語モデル(LLM)に対応 「Amazon 秋の製品発表イベント」で

写真拡大 (全10枚)

Amazonは日本時間の9月21日0時より、Alexa関連やセキュリティ関連のデバイスを多数発表するイベントを米国で開催した。恒例の「Amazon 秋の製品イベント」だ。

読者が最も気になっているのはAmazon EchoデバイスとAlexaの生成AI対応だろう。結果から言うと、Echoデバイスでは「Echo Show 8」の新型モデルが発表され、Alexaは大規模言語モデル(LLM)と連携する。なお、日本向け「Echo Show 8」の新型モデルの発表はまだない(現在時点は発表も未定とのこと)。

「Echo Show 8」(第3世代)、デバイスの側面から背面が丸みを帯びているように見える
■「Echo Show 8」3rd Gen:

●Dave Limp氏が新しいAlexaの機能をデモ

イベントはAmazonデバイスとサービス担当のシニアバイスプレジデント、Dave Limp氏が登壇し、プレゼンテーションの口火を切った。Limp氏は8月にAmazonをリタイアしたため、これが最後の「Amazon 秋の製品イベント」となる。

Amazonデバイスとサービス担当のシニアバイスプレジデント Dave Limp氏

●スマートホーム関連に参入したきっかけ

アマゾンは約9年前からスマートホームの取り組み強化を始めた。そのきっかけをこう語る。
Limp氏は「私たちは、家電業界の研究開発と投資のほぼすべてが携帯電話に集中している実態を見て、人生の大部分を過ごす場所である自宅が事実上、忘れ去られていることに気づきました」と語った。

「私たちは本当に長い道のりを歩んできた」と語り、Alexa対応デバイスやAlexaに接続可能なスマートホームデバイスは、いまや10億台近くに達しているという数字を紹介した。世界的に見れば、ユーザーは毎時間、何千万回もAlexaと対話し、タイマーや音楽だけでなく、スマートホームにもアクセスし、利用率は昨年より25%増加したという。質問は50%以上も増加している。ショッピングでは顧客数が前年比35%増加した。
「Alexaは文字通り何千万もの家庭で家族の一員となっています」と続けた。

●新型「Echo Show 8」発表

新しい「Echo Show 8」はスマートスピーカーとしての性能の要、音楽を楽しむユーザーをより満足させるために空間オーディオを搭載した。これにより、更に広範囲で没入感のあるサウンド体験が生まれるとLimp氏は説明した。「また、空間の音響を感知して最適なサウンドになるように再生を微調整するルームアダプテーションテクノロジーも追加している。

Limp氏が掲げた改良点は、ビデオ通話をさらに向上させるための中央カメラと、バックグラウンドノイズを最小限に抑えるためにアップグレードされたオーディオパイプライン、そしてプロセッサーが高性能化し、表示操作がさらに高速化したこと。また、スマートホームハブも内蔵した。

●人とデバイスとの距離を理解する

次に面白い機能を紹介した。Echo Show 8は、人とデバイスとの距離を理解して画面が切り替わる機能を搭載した。例えば、ホーム画面はユーザーとデバイスの距離に応じて変化し、「Echo Show 8」から離れているときは画面には簡略化されたニュースの見出しや大きな時計表示など、重要な情報だけが表示されているが、ユーザーがデバイスに近づくと、コンテンツはより詳細でタッチしやすいUIに自動的に変わる、という。


「Echo Show 8」の米国での価格は149.99ドル。予約注文で来月から発送となる。日本でも早く使ってみたいところ、続報を待ちたい。

●生成AI/大規模言語モデル(LLM)に対応

Alexaは大規模言語モデル(LLM)に対応し、時に視線やジェスチャーを理解し、継続的な会話を行うことができるようになるという。そして、そのアップデートは2014年に出荷した最初のAmazon Echoを含めて、すべてのEchoデバイスが無料プレビューによって体験できるようになるという(米国)。

●スムーズで継続的な会話のデモ

Limp氏はここでデモを披露する。
Limp氏はAlexaと自身がお気に入りのヴァンダービルト大学のフットボールチームについて会話する。
次に、Limp氏はアレクサに「あなたの好きなスポーツチームはどれかな?」と質問する。するとAlexaはフットボールの話題であることを認識したまま、「デイブ、私はシアトル出身(Amazon社)なので、好きなフットボールチームはシーホークスです」と答える。Limp氏はシーホークスの試合について、細かなところまで質問するが、Alexaは迅速に回答する。

その時点でLimp氏はAlexaとの会話を中断して、聴衆に説明するためにステージ上を歩き回る。その後で再び、「Alexa」というウェイクワードを使用せずに、Alexaとの会話に戻る。

フットボールの話の後にも会話が続いたが、その都度、Alexaとの会話が中断したところから再開できることに聴衆は拍手を送った。


会話も自然でなめらかで迅速、人と会話しているのに非常に近い感覚で行われているように感じた。

●ウェイクワードは要らない

この時、どんなイノベーションが起こっていたのか。
「Alexa」というウェイクワードを何度も言う必要がなくなった。新しいオプション機能によって、Visual IDに登録しているユーザーは、画面に向かうだけでAlexaとの会話を始められるようになった。

●日本後の会話がどう変わるかはもう少し待つべし

そして、新しい音声認識システムは、ユーザーの自然な「間」や「ためらい」を理解・調整して、より自由な会話を実現する。
そしてもうひとつ、Alexaはコンテキストに基づき、発話の口調や感情をコントロールし、調整できるようになったのだ。

実際のところ現時点では日本語版がどうなるかはわからない。だが、今後のAlexaに期待できるデモンストレーションだった。なお、生成AIを活用したAlexaとは「Alexa, let's chat.」でも会話が楽しめるようになる。

■"Alexa, let's chat." | Experience new Alexa capabilities: