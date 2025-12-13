米Google（グーグル）は、「Gemini Deep Research エージェント」と、これを開発者が利用するためのAPI「Interactions API」を公開した。あわせて、複雑な検索タスクを評価するベンチマーク「DeepSearchQA」をオープンソース化して提供する。

「Gemini Deep Research エージェント」

「Gemini Deep Research エージェント」は、開発者が自社アプリケーションに「Gemini Deep Research」を組み込むために提供され、「Interactions API」経由で利用できる。

推論コアに「Gemini 3 Pro」が採用され、複雑なタスクを実効中でもハルシネーションを減らし、品質を高めるという。

Deep Researchは調査を反復的に計画し、クエリーを作成し、検索結果を読み込み、知識ギャップを特定して再び検索を行う。今回のリリースでは、Webサイトの検索が大幅に改善され、サイトの深部にある特定のデータでさえアクセスできるようになった。

「Gemini Deep Research エージェント」は、「Humanity’s Last Exam（HLE）」および 「DeepSearchQA」において最先端の結果を達成したほか、BrowseCompでもGoogle史上最高の性能を記録した。

ベンチマーク結果

「DeepSearchQA」

Googleは、「Gemini Deep Research エージェント」の提供開始に合わせて、検索タスクのベンチマーク「DeepSearchQA」をオープンソース化した。

「DeepSearchQA」は、17分野にわたる900の「因果連鎖」タスクで構成され、各ステップは前段の分析に依存している。従来の事実をベースとしたテストとは異なり、網羅性を測定してエージェントに徹底的な回答セットの生成を求める。

このほか、「DeepSearchQA」は「思考時間（thinking time）」の効果を診断するツールにもなる。内部の評価では、エージェントにより多くの検索と推論ステップを許可すると、大幅に性能向上が確認できたという。