Googleが2024年5月に発表したAIモデル「Gemini 1.5 Flash」は、ベンチマークテストにおいて高性能なGemini 1.5 Proに匹敵する性能を発揮できるにもかかわらず、Gemini 1.5 Proのわずか10分の1という低価格が特徴の一つです。そしてGoogleは2024年8月12日から、Gemini 1.5 Flashの大幅な値下げを実施することを発表しました。

Gemini 1.5 Flash price drop with tuning rollout complete, and more - Google Developers Blog

https://developers.googleblog.com/en/gemini-15-flash-updates-google-ai-studio-gemini-api/



Gemini API の料金  |  Google AI for Developers

https://ai.google.dev/pricing





Gemini 1.5 Proに匹敵する性能を持つ軽量モデルのGemini 1.5 Flashは、コンテキストウィンドウはGemini 1.0 Proの4倍に相当する3万2000トークンで、一度に多くの情報を処理可能です。Gemini 1.5 Flashについては、以下の記事で詳しくまとめています。

Googleが高速かつ高性能な軽量AIモデル「Gemini Flash」を発表、Gemini Proの10分の1の価格で性能は同等クラス - GIGAZINE



これまでGemini 1.5 Flashは無料で利用可能だったほか、レート制限が緩和される有料プランも提供されていました。今回、Googleはこの有料プランの値下げを実施することを発表しています。

100万トークン当たりの値下げ前と値下げ後の料金体系を示した表が以下。128万トークン以下では、入力・出力ともに70%以上の大幅な値下げが予定されています。

 トークン数入力出力コンテキストキャッシュ値下げ前12万8000より大きい0.70ドル(約102円)2.10ドル(約308円)0.175ドル(約25円)値下げ後0.15ドル(約22円)0.6ドル(約88円)0.0375ドル(約5.5円)値下げ前12万8000以下0.35ドル(約51円)1.05ドル(約154円)0.0875ドル(約12円)値下げ後0.075ドル(約11円)0.3ドル(約44円)0.01875ドル(約2.75円)

Googleは「値下げされたこれらの料金とコンテキストキャッシングなどのツールにより、開発者はGemini 1.5 Flashのロングコンテキストとマルチモーダル機能を使用してシステムを構築する際に大幅なコスト削減を実感できるはずです」と述べています。

さらにGoogleはGemini 1.5 ProとGemini 1.5 Flashの両方で100以上の言語に対応したことや、Gemini 1.5 Flashのテキストチューニングを実施したことを報告しています。特にテキストチューニングでは、プロンプトのコンテキストサイズが縮小される他、待機時間の短縮、コストの削減、タスクに対するモデルの精度の向上が期待されています。

加えてGemini APIにおける開発者向けドキュメントの操作性が向上したことや、Gemini APIでのPDFの処理が可能になったことが発表されています。