Image: Google

2025年11月19日、Googleが新しい生成AIモデル「Gemini 3 Pro」を公開しました。GeminiなどのGoogleのAIアプリ・サービスに用いられている主要な大規模言語モデル（LLM）の最新版です。大きく5つの機能を備え、ベンチマークは前モデル Gemini 2.5 Proから大きく向上しています。

GeminiアプリやGoogle検索のAIモード、Google AI StudioやGemini CLIなどで本日から利用可能とのことです。筆者の環境ではWeb版Gemini・Vertex AIで利用できるようになっているのを確認しました。アプリ・検索で使えるとのことですが、現時点で筆者の環境にはまだきていません。（10:04更新）人によって反映には時差があるかもしれません。

Image: Google AI/X

大きく伸びたベンチマーク

以下の画像にはGoogleによるベンチマークの結果が示されています。Google自身によるものなので当然Google有利に書かれているとは思われますが、ほぼすべてのベンチマークでGPT-5.1・Claude Sonnet 4.5を上回っているのがまずわかります。

また、「Humanity's Last Exam」が前モデルの21.6%からツールなし37.5%・ネット検索＆コード実行ありで45.8%まで上昇している点にも注目です。このベンチーマークは人間の知性の限界を探るものであり、高難易度の問題への対応力が格段に伸びていると思われます。OpenAIも重視しているベンチマークで、GPT-5も大きな伸びを見せ、GPT-5.1も高い水準にありますが、遙かに上回っています。

Image: Sundar Pichai/X

LLM性能評価サイト「LM Arena」「Artificial Analysis」の評価でもトップとなっています。

Image: Demis Hassabis/x

Image: Artificial Analysis

実際に使ってみないと何とも言えませんが、GPT-5.1などが既に高い性能を見せているため、最低でもそれと同水準程度はあるのではないかと思われます。

「人間の手を煩わせない」を狙う5つの機能

Google CEO スンダー・ピチャイ氏の紹介によると、Gemini 3（Gemini 3 Proがサービスに利用されるとこの表記になる模様。「Gemini 3ファミリー」を意味する表記なので、軽量版も今後出そうです。10:05追記）には大きく5つの機能が備わっています。方向性は「人間の作業の自動化」を強く打ち出すOpenAIとはかなり質が異なる印象で、「最初から手を加えなくていいものを出す」を重視している感があります。

1. どんなファイルも「ユーザー好みのインタラクティブな形式」に変える

1/ Gemini 3 in action, a quick



You can give Gemini 3 anything (images, pdfs, scribbles, etc) and it will create whatever you like: an image becomes a board game, a napkin sketch transformed into a full website, a diagram could turn into an interactive lesson. pic.twitter.com/xCry35mFbW - Sundar Pichai (@sundarpichai) November 18, 2025

サンプルでは、画像からチェスゲームを生成するなどしています。ウェブサイトなども作成可能とのこと。対応するファイルは、画像・PDF・手書き文字の写真が挙げられており、それ以外にも対応しているようです。さくっと何でも作れる機能、って感じでしょうか。

2. 動画の分析

Gemini 3は高い推論能力だけでなく、視覚的・空間的な情報を理解することもできます。これを利用して「動画の分析」が可能です。例では、テニス中の映像をアップし、テクニック的な問題がないかを洗い出してもらう様子が紹介されていました。

3. 検索内容を補足する映像の生成

Gemini 3はGoogle検索に統合され、AI検索でも利用可能です。例では、天体力学に関する問題（三体問題）について質問すると、それがどのような現象なのかを視覚的に伝える映像を生成しました。この映像はインタラクティブで、速度を調整することもできていました。

Google検索のAI Modeで利用可能な機能ですが、日本ではまだ使えません（英語のみ対応の模様）。

4. 画像やテキストをいい感じに並べ替え

回答を生成する際に「どういう感じでレイアウトするか」を指定でき、ユーザーが読みやすい、好みのレイアウトで生成してもらえます。例では「3日間のローマ旅行の日程」を生成してもらっており、この機能を利用することで写真や表を用いた見やすい回答にしています。

5. ユーザーのタスクを肩代わり。エージェント機能が追加

「エージェント機能」とは、AIが人間が行うようなPC作業などを行える機能のことを指します。OpenAIが先行していた分野でしたが、Gemini 3には「Gemini Agent」という機能が実装され、差が埋まってきたように見えます。

メールボックスを整理し、メール内容からスケジュールの追加と返信を提案、承認するとそのまま実行、という例が紹介されています。どの程度のことができるかは、実際に試してみないと、という印象です。

Google AIの最上位プラン「Ultra」利用者向けの機能となっています。

Source: Google

