Image: Google

Lifehacker 2024年6月28日掲載の記事より転載

最近、避けて通るのが難しい話題と言えば、やはり人工知能(AI)です。AIは、「テック業界に到来した次の大革命」として、今まさにもてはやされています。

「猫も杓子もAI」という状況のなかで、Googleも、業界をリードする存在になろうとして、あの手この手で努力しています。

同社のAIに関する取り組みは、「Gemini」という総称で呼ばれていますが、実際のところ「Google Gemini」のブランド名で提供されるサービスの形や規模は多岐にわたります。

意外とややこしいGemini(+ネーミングの理由)

GoogleはGeminiという名前を、自社のAIモデル(この人工知能の基盤となるテクノロジー)とAIアプリ(ウェブやスマートフォンでアクセスできるサービス)の両方に使っています。

そのため、その時々でどちらの話をしているのか、どちらを使っているのか、特定が難しいところもあるのです。

さらに、現在のGeminiアプリは、2024年2月までは「Google Bard」という別の名で呼ばれていたことも、混乱に拍車をかけています。

Geminiには今も、新たな製品や機能が続々と追加されています(その最新例が、5月の「Google I/O 2024」イベントで発表された新機能の数々です)。

このような状況を踏まえて、「そろそろGeminiの名で呼ばれるツールそれぞれの正確な意味を解説するべき時が来た」と、米Lifehacker編集部では判断しました。

紛らわしいGoogleのAIツールについて理解し、フル活用するために、以下の説明を参考にお役立てください。

Geminiの名前は「宇宙」にちなむ

なお、本題に入る前に、興味がある方向けの追加情報をお伝えししておきましょう。

Googleが、「双子」を意味する「Gemini」というラテン語を選んだのは、2つのAIプロジェクトが、同時に社内で開発されていたことに由来します。

また、宇宙につながる意味があることも、選ばれた理由の1つです。Geminiは、空にある星座(そして占星術で使われる12星座の1つである)の「ふたご座」を指す言葉です。

さらに、アメリカ航空宇宙局(NASA)が1960年代に進めていたプロジェクトの名前でもあります。

つまり、GoogleはGeminiという名前に、宇宙開発への大志を込め、テキスト/画像/動画というさまざまなメディアを扱えるこのAIのマルチモーダルな側面を反映させたわけです。

「Google Gemini」アプリと料金プラン

Android版Geminiアプリ

まずは、Googleが提供する「Gemini」アプリについて説明しましょう。Android版がダウンロード可能なほか、ウェブ版にもブラウザ経由でアクセスできます。

原文記事の執筆時点では、iOS向けGeminiアプリはリリースされていませんが、iOS版の「Google」アプリを起動して、トップページの上の方に表示されている「Gemini」アイコン(青と紫のグラデーションの星形マーク)をタップすれば、Geminiにアクセスできます。

アプリ版のGeminiについては、OpenAIの「ChatGPT」や、Microsoftの「Copilot」に相当するサービスと考えて差し支えないでしょう。

プロンプトを入力すると、生成AIによる回答を得ることができます。詩や小論文を書いてもらう、旅行のプランを練る、決断のヒントを得るなど、ほぼあらゆるトピックについてアドバイスが得られます(ただし、AIが事実に反する回答をするハルシネーションには気をつけてください)。

料金プランは2つ

Google Geminiアプリは、2つの料金プランから選ぶことができます。

基本プランは、すべての人に無料で提供されているもの。一方の有料プランでは、より高度なGeminiモデルにアクセスできます。詳細についてはのちほど詳しく説明しますが、簡単に言うと、高度なモデルではより賢く、レスポンスが速く、汎用性が高くなります。

現時点では、Geminiのサブスクリプションプランは「Gemini Advanced」の1つだけです。また、これは「Google One」のプランと重なる部分もあります。

Gemini Advancedの料金は月額19.99ドル(日本では2900円)。より高度なモデルが使えるのに加えて、AIを活用した便利な機能もいくつか追加で提供されています。

具体的には、ドキュメントのアップロード、Pythonのコードの実行、そしてGmailやGoogleドキュメントといったGoogleアプリからGeminiにアクセスする機能などです。

Googleアプリを通じて使える2TBのストレージも与えられますが、これはGoogle Oneと共通する部分です。また、Googleストアでのショッピングが10%オフになるなど、そのほかのGoogle Oneに付随する特典も含まれています。

ちなみに、AI関連の追加機能がなく、2TBのストレージが使える通常のGoogle Oneプレミアムプランの料金は、月額9.99ドル(日本では1300円)です。

「Google Gemini」モデルの詳細

4モデルのGemini

Googleはアプリに加えて、同社のAIモデルもGeminiと呼んでいます。こちらは、生成AIを支えるさまざまなタスクを担っているエンジンで、テキストの構文解析や出力を行なう大規模言語モデル(LLM)もここに含まれます。Geminiモデルには、現時点で3つのモデルがあり、そのすべてについて継続的に開発・アップグレードが行なわれています。

Googleが提供するメインモデルは、次の3つ。

Gemini Ultra…もっとも大規模で能力も一番高いモデル

Gemini Pro…「AIタスク全体のスケーリング」に最適とされるモデル

Gemini Nano…デバイス上でタスクを処理するモデル

これらのモデルには、さらにできることが増え、高機能になるに従って、新たなバージョン番号が付与されていきます。

これらのメインモデルのほかに、軽量版Gemini Proとされる「Gemini Flash」、そして、まだ初期段階ながら、Geminiモデルを用いてあらゆるタスクに対応可能なAIエージェントを作成しようとする取り組み「Project Astra」があります。

実際にどのモデルを使用しているの?

アプリとモデルの関係について説明すると、無料版のGeminiアプリのエンジンとして使われているのがGemini Proです。

有料版のGemini Advancedを使っている場合は、より高機能なバージョンのGemini Pro(原文記事の執筆時点では、Gemini AdvancedではGemini Pro 1.5モデルが使われています)か、Gemini Ultraか、どちらかのモデルが採用されているはずです。Googleはこの2つを、その時々に応じて切り替えているようです。

これらのモデルは大量のデータを処理するため、通常はGoogleのデータサーバー上のクラウドで実行されています。

Gemini Nanoについては、サイズが小さいため、「Pixel 8」などのスマートフォンにも搭載可能です。規模が小さいため、能力はProやUltraに及びませんが、ユーザーのデバイスでローカルに実行されるので、レスポンスが速く、プライバシーの面でもより安心感があります。

これらのモデルは、猛スピードで進化を続けています。

各タイプのモデルについて、「Google DeepMind」ハブをチェックして、それぞれの最新情報や、Geminiアプリを含むGoogle製品での使用事例を確認しておきましょう。

Photo: Google