Googleは2024年5月に、高速かつ高性能な軽量AIモデル「Gemini 1.5 Flash」を発表しました。これをさらに軽量化し、価格を抑えたバージョン「Gemini 1.5 Flash-8B」の製品版が2024年10月3日にリリースされました。

Gemini 1.5 Flash-8B is now production ready - Google Developers Blog

https://developers.googleblog.com/en/gemini-15-flash-8b-is-now-generally-available-for-use/



Gemini 1.5 Flash-8B is now production ready

https://simonwillison.net/2024/Oct/3/gemini-15-flash-8b/

Googleが発表したAIモデルのGemini 1.5 Flashは、ベンチマークテストにおいてGemini 1.5 Proに匹敵する性能を誇りながら、Gemini 1.5 Proより大幅に安く使える点が特徴です。

Googleが高速かつ高性能な軽量AIモデル「Gemini Flash」を発表、Gemini Proの10分の1の価格で性能は同等クラス - GIGAZINE



Googleはリリース後の数カ月間でGemini 1.5 Flashに改良を加え、さらに小型で高速なバージョン「Gemini 1.5 Flash-8B」を開発しました。Gemini 1.5 Flash-8Bは9月に実験版としてリリースされており、10月には製品版がリリースされました。

Gemini 1.5 Flash-8Bは軽量化されたモデルでありながら、多くのベンチマークでGemini 1.5 Flashと同等のパフォーマンスを発揮しているとのこと。

Gemini 1.5 Flash-8BはGeminiシリーズの中で最も低価格で利用可能となっており、Googleは「Gemini 1.5 Flashと比較して50%安い」とうたっています。具体的なコストは「プロンプトの入力100万トークンあたり0.0375ドル(約5.5円)」「プロンプトの出力100万トークンあたり0.15ドル(約22円)」「プロンプトのキャッシュ100万トークンあたり0.01ドル(約1.5円)」で、プロンプトが1万2800トークンを超えた分はそれぞれ倍額となります。



有料プランの開発者の場合、請求は10月14日から開始されるとのこと。Googleは、「この新しい価格は、Gemini 1.5 FlashとGemini 1.5 Proで開発者のコスト削減のために行ってきた作業と共に、開発者が世界を前進させる製品やサービスを自由に構築できるようにするという私たちのコミットメントを強調しています」と述べています。

また、Gemini 1.5 Flash-8Bは小さなプロンプトに対する遅延がGemini 1.5 Flashよりも低減されているほか、レート制限は2倍に引き上げられているとのことです。

開発者はGoogle AI StudioとGemini APIを介して、Gemini 1.5 Flash-8Bにアクセスできます。

Untitled prompt | Google AI Studio

https://aistudio.google.com/app/prompts/new_chat?model=gemini-1.5-flash-8b-002

Gemini models  |  Gemini API  |  Google AI for Developers

https://ai.google.dev/gemini-api/docs/models/gemini