Image: viewimage / Shutterstock.com

面倒臭いことは全部やってくれるパーソナル秘書そのもの！

昨年、Google（グーグル）は自社のAIモデル「Gemini」をChromeブラウザに組み込みました。そして今回、その動きをさらに加速させて、Gemini 3モデルをブラウザにさらに深く組み込む新機能を発表しました。マルチタスクができるサイドパネル、Googleアプリとの連携、そしてユーザーの指示に従ってウェブを操作する「Auto Browse」と呼ばれる機能などです。

タブをまたいで使えるマルチタスク

今回の発表でGoogleが前面に押し出しているのは、新しいサイドパネル。このパネルは、Geminiがタブをまたいで常に画面上に表示され、閲覧のアシスタントとして活躍します。Googleによると、ユーザーはメインで見ているブラウザタブを開いたまま、サイドバー内で別の作業を行なえるようになります。

報道関係者向けのデモンストレーションでは、Chrome担当副社長のParisa Tabriz氏がこのサイドバーについて、

画面に表示されているコンテンツの横に、アシスタントを並べて置くことができます。そして何より大事なのは、必要であれば別のタブでまったく新しい会話を始めることもできる点です。

と説明しています。

Googleによると、この機能によってブラウザ上でのマルチタスクのやり方が広がってくるとのことです。Googleのブログ投稿では、

テスターたちは、開いた複数のタブをまたいで選択肢を比較したり、複数のサイトにある商品レビューをまとめたり、予定がたくさんランダムに入っているカレンダーの中から特定の予定を見つけたりと、さまざまな用途で使っています。

と説明されています。

Googleサービスとの連携強化

さらに、Googleの各種サービスとの連携もできるようになります。Gmail、カレンダー、YouTube、マップ、Googleショッピング、GoogleフライトとGeminiアシスタントを接続することが可能で、各サービス内で作業を行なえるとのこと。デモでは、Tabriz氏が、Gemini上でメールを書き、そのままサイドバーから送信できること実演。

また、Googleは使用例として、

学会に出張するためにフライトを予約しなければいけない場合、Geminiがその予定の詳細が書かれた過去のメールを探し出し、Googleフライトの情報を参照してフライトの候補の提案を行ない、その後、到着時間を同僚に伝えるメールの下書きを作成します。

と説明しています。これはパーソナルアシスタントそのものですね。

ユーザーはGeminiの設定画面にある「Connected Apps」セクションで、どのGoogleアプリへのアクセスを有効にするかを選べるとのこと。

さらにGoogleは、画像生成ツールのNano Bananaも導入。このツールは、画像をダウンロードすることなく、ブラウザ上で直接画像を変換することができます。ユーザーがサイドパネルでGeminiに指示を入力すると、その場で画像が編集されます。

有料プラン限定のAuto Browse

今回発表された中で、特に注目を集めている強化機能の一つは、Google AI ProおよびGoogle AI Ultraの有料プラン限定となっている「Auto Browse」機能。これは自動入力を強化したものとして位置付けられていますが、とはいえ完全に同じものというわけではないようです。Auto Browseはエージェント型の機能で、ユーザーが複数の手順の作業をGeminiに指示すると、ブラウザ内でタブやサービスをまたいで処理を進めてくれます。

Tabriz氏は、

Auto Browseは、単に情報を伝える段階から、実際にブラウザを操作して、ユーザーの代わりに作業を行なうところまで踏み込みます。

と述べています。

デモでは、Tabriz氏が一年前に購入したジャケットを再注文するようGeminiに指示。すると、Geminiは新しいタブを開き、該当する企業のウェブサイトに移動し、Tabriz氏のアカウントにログインし、過去の注文履歴を確認して指示に合致する商品を見つけ、再注文の手続きをするという作業をやってのけています、すごいぞGemini！

Tabriz氏によると、Geminiは可能なところまで作業を進め、途中で問題に直面した場合はユーザーに確認を求めるそうです。また、購入の確定前には必ず処理を止め、ユーザーの承認を得るとのこと。この機能はEtsy、Shopify、Target、Wayfairに対応しています。

Googleはまた、この機能が旅行の計画をする際の、複数の日程を比較しながらホテルや航空券の料金を調べるといった、日常的で手間のかかる作業にも使われていると説明しています。

テスターたちは、予約のスケジュール調整、面倒なオンラインフォームの入力、税務書類の収集、水道業者や電気工事業者の見積もり取得、請求書の支払い確認、経費精算、サブスクリプション管理、運転免許証の更新手続きの効率化など、さまざまな用途で使っています。かなりの時間短縮につながっています。

とGoogleは説明しています。

Personal Intelligence導入予定と今後の展開

今月初め、GoogleはGeminiの「Personal Intelligence」を発表しました。これは、GmailやGoogleカレンダー、GoogleドライブやGoogleフォトの中身、YouTubeの視聴履歴やGoogle検索履歴など、Googleのエコシステム全体での利用履歴をもとに動作する機能。Googleは今後数か月以内に、このPersonal IntelligenceをChromeにも導入するとしています。

また、Chromeは過去の会話を記憶できるようにもなります。この機能はオプトイン形式で、ユーザーはどのアプリをChromeのPersonal Intelligenceに含めるかを選択できます。

Tabriz氏によると、Geminiはユーザーのデバイス上でローカルに動作しつつ、一部のデータはクラウドに送信されるとのこと。新しいサイドパネルやNano Bananaの統合機能は、米国Chromeユーザー向けに利用がスタート。Auto Browseも、AI ProおよびAI Ultraの契約者向けにアメリカではすでに利用可能となっています。Personal Intelligenceは今後数か月以内に提供される予定です。日本での利用はいつになるんでしょうか。