Googleが高速かつ高性能な軽量AIモデル「Gemini Flash」を発表、Gemini Proの10分の1の価格で性能は同等クラス

2024年5月15日 12時4分

Googleが軽量かつ高性能なAIモデル「Gemini Flash」を2024年5月15日(水)に開催された「Google I/O 2024」で発表しました。Gemini FlashはGemini Proの10分の1の価格で利用可能で、ベンチマークテストではGemini Proに匹敵する性能を示しています。

Gemini Flash - Google DeepMind

https://deepmind.google/technologies/gemini/flash/

Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra

https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/

Gemini FlashはAPI経由で動作するGeminiシリーズの中では最も軽量なモデルです。Gemini Flashは処理速度を重視して開発されており、開発者やエンタープライズの一般的な用途では平均レイテンシーが1秒未満とされています。また、Gemini Flashのコンテキストウィンドウは100万トークンで、「1時間の動画」「11時間の音声」「3万行以上のコード」といった膨大なデータを処理可能です。

Geminiシリーズのベンチマーク結果を並べた表が以下。Gemini FlashはGemini 1.0 Proのスコアを大きく上回っているほか、一部のテストではGemini 1.5 Proのスコアも上回っています。

Gemini FlashはGemini APIとVertex AIで利用可能。Gemini APIは無料でも利用可能なほか、レート制限が緩和される有料プランも用意されています。有料プランの料金は、12万8000トークン以内のプロンプトの場合は100万トークン当たり0.35ドル(約55円)で、12万8000トークンを超えるプロンプトの場合は100万トークン当たり0.70ドル(約110円)です。なお、いずれの価格もGemini Proの10分の1です。

Gemini Flashの有料プランは2024年5月30日(木)から利用可能となります。

なお、Gemini Flashの発表と同時に、Gemini Proのアップデートも発表されました。Gemini Proのアップデート内容は以下の記事で確認できます。

GoogleがGemini 1.5 Proのアップデートを実施、コンテキストウィンドウを従来の100万トークンから200万トークンに拡張 - GIGAZINE