GoogleがGemini 1.5シリーズの性能強化版モデル「Gemini-1.5-Pro-002」と「Gemini-1.5-Flash-002」を発表しました。両モデルは強化前と比べて数学性能や視覚理解性能などが向上しているとのこと。また、Gemini 1.5 Proの値下げも発表されています。

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more - Google Developers Blog

https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/

Gemini 1.5 FlashおよびGemini 1.5 Proの2024年5月版と今回発表された2024年9月版のベンチマーク結果をまとめた表が以下。両モデルともに、ほとんどのベンチマークで2024年9月版の方が高いスコアを記録しています。特に、数学性能を測定するベンチマークでは約20%の性能向上を達成。さらに、視覚理解やコーディング性能も向上しています。



Gemini 1.5 Flashは処理速度の向上やレイテンシの低減にも力をいれているとのこと。以下の左側のグラフは2024年6月から9月までの期間の「1秒ごとに処理できるトークン数」の推移を示し、右側のグラフは「最初のトークンを受け取るまでの時間(レイテンシ)」の推移を示しています。グラフを見ると、秒間処理トークン数が増大し、レイテンシが短縮されていることが分かります。



GoogleはGemini 1.5 Proの値下げも発表しました。128Kトークン以下の場合、入力は100万トークン当たり1.25ドル(約179円)、出力は100万トークン当たり2.50ドル(約358円)。128Kトークンより大きい場合は、入力が100万トークン当たり5ドル(約716円)、出力は100万トークン当たり10ドル(約1431円)となります。新たな料金体系は2024年10月1日に適用開始予定です。



さらに、GoogleはGemini 1.5 Flashのレート制限を1000RPMから2000RPMへ、Gemini 1.5 Proのレート制限を360RPMから1000RPMへ引き上げることも発表しています。

なお、GoogleはGoogle WorkspaceにGeminiのスタンドアロンアプリを追加したことも発表しています。

We’re expanding Gemini access to more customers | Google Workspace | Google Workspace Blog

https://workspace.google.com/blog/product-announcements/google-workspace-extends-gemini-benefits-to-more-customers