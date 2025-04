Googleが2025年4月17日、推論AIモデル「Gemini 2.5」シリーズに、「Gemini 2.5」シリーズに、コストパフォーマンスに優れた「Gemini 2.5 Flash」を追加したことを発表しました。Start building with Gemini 2.5 Flash - Google Developers Bloghttps://developers.googleblog.com/en/start-building-with-gemini-25-flash/

Gemini 2.5 Flash is now in previewhttps://blog.google/products/gemini/gemini-2-5-flash-preview/Start building with Gemini 2.5 Flashhttps://simonwillison.net/2025/Apr/17/start-building-with-gemini-25-flash/今回発表されたGemini 2.5 Flashは、2025年3月にリリースされた推論AIモデル「Gemini 2.5」シリーズの1つです。推論モデルとは、答えを出す前に追加の計算能力と時間をかけて事実確認と問題の推論を行うことで、数学的な問題やコーディングなどでも高い精度の出力を可能とするもので、従来の大規模言語モデルが苦手としていた数学的な問題やコーディングなど、論理力を問われる複雑なタスクでも高い精度での出力が可能とされています。Googleが次世代推論AIモデル「Gemini 2.5」発表、推論とコーディング性能が大きく向上 - GIGAZINEGemini 2.5 Flashでの各種ベンチマーク結果をまとめた表が以下。Gemini 2.5 Flashは2025年2月リリースのGemini 2.0 Flashに対し多くのベンチマークで高い結果を残しています。また、Gemini 2.5 Flashの100万トークンあたりの料金は入力が0.15ドル(約21円)、出力が最大3.5ドル(約500円)で、入力に1.1ドル(約156円)、出力に4.4ドル(約626円)を要するOpenAIの推論モデル「o4-mini」よりも安価ながら、ベンチマークではo4-miniに近い結果を示しています。GoogleはGemini 2.5 Flashについて「コストパフォーマンスが最高のモデル」とアピールしており、以下のグラフではGemini 2.5 Flashが他のAIモデルに比べて安価でありながら、大規模言語モデルのパフォーマンスを比較するためのオープンソースAIベンチマークであるChatbot Arenaではスコアが上位に位置していることが示されています。Gemini 2.5 FlashはGoogle AI StudioやVertex AIで利用できます。ソフトウェアエンジニアのサイモン・ウィルソン氏は実際にGemini 2.5 Flashを用いて画像生成を行っています。ウィルソン氏は「自転車に乗ったペリカン」を大規模言語モデルに描かせるという独自のベンチマークを考案しており、今回もGemini 2.5 Flashに対して「Generate an SVG of a pelican riding a bicycle(自転車に乗っているペリカンをSVG形式で生成してください)」というプロンプトを入力しました。「Reasoning(推論)」機能をオンにして生成された画像が以下。ウィルソン氏によると、この画像の生成には1.4933セント(約2.1円)を要したとのこと。続いて「Reasoning」機能をオフにして生成された画像がこんな感じ。生成に要したコストは0.1025セント(約0.15円)です。思考に費やすリソースを最大化した状態で生成した画像が以下。5174個の出力トークンのうち3023個が推論に用いられ、コストは1.8111セント(約2.58円)でした。ウィルソン氏は「Gemini 2.5 FlashのSVGへのアプローチについて私が本当に評価していることの1つは、Gemini 2.5 FlashがCSSやコメント、および一般的なSVGクラス構造に非常に優れたセンスを示していることです」と評価しています。また、掲示板サイト・Hacker Newsでは「Gemini 2.5 Flashはコストパフォーマンスが最高なマルチモーダルツールです。GoogleはAI開発競争に勝利しました」とのコメントや、「GeminiのFlashシリーズは、高速かつコストパフォーマンスに優れており、エンドユーザーにピッタリです」との評価も寄せられています。