グーグルの画像生成・編集用のAIモデル「Gemini 2.5 Flash Image」（Nano Banana）が公開から1週間強で2億枚の画像が編集された。グーグルが報道陣向けの説明会で明らかにした。説明したのは、Geminiアプリでマルチモーダル対応技術の開発をリードするデビッド・シャロン氏。

顔が変わらない画像AIが人気

Gemini 2.5 Flash Imageは、グーグルが8月26日に発表した画像生成・編集用のAIモデル。単なる生成ではなく、論理的思考や知識をベースにして生成することが強みで、AI加工した際に起きる「自分の顔が変わってしまう」現象を軽減し、実際の姿との差異を少なくしたことが特徴。

カジュアルな写真をプロフェッショナルな顔写真に変換、漫画やミームの作成、「80年代の自分」のように、髪型、メイク、服装をその時代に合わせて生成、テキストによるプロンプトで帽子をかぶせたり、絵画の中に自分を登場させたりすることもできる。Gemini Image 2.5を用いている。iPhoneとAndroidで品質に違いがない。ベースとして「Gemini Image 2.5」と名付けられた、生成AIモデルが用いられている。シャロン氏は、単なる画像生成モデルではなく、Geminiをもとにしていることから、それらのロジックと推論などを用いているという。

「Nano Banana」という名称は、匿名でAIモデルを比較できるWebサイトに提出する際、グーグルと関連付けられないよう命名されたが、同社の製品であることはすでに周知の事実となっている。

グーグルによると、8月26日の公開から現時点ですでに2億枚の画像がGemini 2.5 Flash Imageを通じて編集され、今も数字は伸び続けている。アジア諸国での利用動向が強く、フィリピンでは2500万枚、インドネシアでは2000万枚、タイでは1840万枚の画像が生成された。利用動向の多い3カ国では、自らを「フィギュア」として写真を加工するプロンプトの利用が盛んという。

プロンプトを連続して入力すると、顔が変わってしまうケースもあるが、グーグルによれば、現在の技術的な課題のひとつで今後、ユーザーからのフィードバックなどをもとに改善を進めるとしている。ほかに、元の画像をそのまま返すケースもあるとして同様に改善する。

今後は動画生成も

高度な画像生成が可能になることで懸念されるディープフェイクへの対策については、プロンプトに制限を加えることで不適切な画像の生成を防ぐ。生成された画像には、目に見えるダイヤモンドマークと改ざん不可能かつ目に見えない「SynthID」によるデジタル透かしが埋め込まれる。

スタンドアロンでのアプリ提供はない。投入したばかりのサービスで、最優先事項は急増するニーズに対応してサービスを安定させることといい、Pixelへの統合など将来的な展望については直接的な言及はなかったものの、シャロン氏は時期は未定ながら、画像から動画を生成する機能の追加も視野に入れるとした。