Image: Google

Lifehacker 2025年9月1日掲載の記事より転載

AIによる画像編集は、ますます巧妙になり、操作もずっと簡単になってきています。

GoogleがGeminiアプリ（およびウェブサイト）をアップデートし、画像生成がより直感的に使えるようになりました。

正直なところ、これまでお遊びレベルだと見過ごしていた機能が、いよいよPhotoshopの代替となり得るレベルに達したかもしれません。

もちろん、典型的なAIっぽさが残る部分もあります。しかし、「nano banana」というコードネームでテストされ、現在は「Gemini 2.5 Flash Image」として全ユーザーに公開されているこの新モデルは、画像を好みに合わせて微調整するための多くの機能を提供しています。

生成された画像には依然として透かし（ウォーターマーク）が入り、メタデータには「AIによって生成された」という警告が記載されます。

それでも、写真が本物かどうか、これまで以上に見極める必要が出てきそうです。新しいGeminiは、その境界線をかつてないほど曖昧にしています。

写真編集がパワーアップ

今回のアップデートされたモデルが特別なのは、複数の写真にまたがって細部を維持することに重点を置いている点です。

これまでのGeminiアプリは、写真を要求するたびに、ほぼゼロから画像を生成していました。しかし今では、元の写真や以前に生成した画像の一部を引き継ぎ、指示された部分だけを変更できるようになったのです。

これが重要である理由は2つあります。皮肉なことに、そのうちの1つは、実はAIの使用を減らすことにつながります。

赤いシャツを、青いシャツに

たとえば、あなたが赤いシャツを着ている写真を持っていて、それを青に変えたいとしましょう。以前は、選択肢は2つでした。

自分でPhotoshopに画像を取り込み、手動で修正する。AIへのプロンプト（指示）としてその画像を使い、元の写真に十分近く、かつシャツが青色になった画像が出てくるまで、何度も生成を繰り返す。

しかし、「nano banana」の変更により、Googleのモデルは画像の大部分をそのままに、シャツだけを変更するように微調整されました。

実際に、私の写真で試したのがこの画像です。

モデルが私の髪の縮れ具合や、特定の表情、ポーズといった細かいディテールを維持している点に注目してください。完璧ではありませんし、編集後のバージョンでは肌が少し滑らかに見えることにも気づくでしょう。

それでも、新しいアップデートのおかげで、Geminiは私が「シャツ」と言ったときに何を指しているのかを判断し、その編集の大部分をシャツに集中させることができるようになりました。

ただ、シャツの見た目も、特に右肩あたりが少し不自然な気もします。もっとも、私もプロンプトで多くの情報を与えなかったのですが。そこで、次の大きな変更点が生きてきます。

AI生成画像を、何度も手直しして完成度を高める

重要なのはここから。画像が完全にAIによって生成されたものであってもなくても、以前に生成された画像をベースに、次の生成を行うことができるようになりました。

言い換えれば、Geminiが初回で完璧な結果を出せなくても、満足いくまで再挑戦させることができるのです。

これがどのようなものかを示すために、先ほどの青いシャツの私の写真に、元の赤いシャツと合わせるように水玉模様を追加してもらいました。

そしてこちらが、完全にAIで生成された猫の画像を、オレンジ色に変えてもらった例です。

これはAI画像生成にとって、とてつもなく大きな進歩です。以前は、Geminiがすでに生成したコンテンツに小さな修正を加えるよう頼むと、毎回まったく新しい写真が出てきてしまいました。帽子をかぶった犬のこの画像のように。

しかし今では、同じ写真に何度も繰り返し手を加えられるようになりました。つまり、最初の結果が不自然に見えても、それを修正するチャンスがあるのです。

私にとって、これによってこの機能は単なる目新しいおもちゃから、正真正銘Photoshopを脅かす存在へと昇格したと感じています。

たとえばGoogleは、この機能を使って「自分が違う時代に生きていたら、あるいは違う職業に就いていたらどう見えるかを確認できる」と提案しています。

正直なところ、特に実際の写真を参考にアップロードすれば、その結果はカジュアルな投稿に使うには十分説得力があります。

これは、本物のモナ・リザの隣に立つ私を、アーティストとして再創造したものです。

厳密には現実的ではありませんが（なぜ私の隣にもう1枚モナ・リザがあるのかは謎ですが）、こういう投稿をSNSに溢れさせるタイプの人々がいるのは想像に難くありません。

少し時間をかけて修正を繰り返せば、まるで私が本当にルーブル美術館に行ったかのような写真にさえできるかもしれません。

しかし、私のようなAI懐疑派にとって、このモデルがまだ成長の余地があることを示す、救いとなる点が1つあります。

複数写真の合成は、まだ「AIっぽさ」が抜けない？

新しいGeminiのアップデートは、既存の写真に繰り返し手を加えることをはるかに現実的にしましたが、元写真にあまり頼れない新しいコンテンツを生成させようとすると、やはり目に見える「AIっぽさ」が残ってしまいます。

今回のアップデートでGoogleが発表した追加機能の1つに、複数の元写真を組み合わせて1枚の画像を生成する機能がありました。

しかし、ほかの変更が主に既存の写真に小さな修正を加えるものだったのに対し、この機能は写真を組み合わせるためにAIが多くを「つくり出す」必要があります。そして、ここで昔ながらの問題にぶつかる可能性がもっとも高いのです。

たとえば、Googleが提案する使用例に従い、私自身と私の猫の写真をGeminiにアップロードし、私たちが一緒に抱き合っている写真をつくってくれるよう頼みました。

しかし、このアップデートで試したほかのテストでは元写真に非常によく似ていたのに対し、ここでの結果は、ピチピチすぎるシャツ、ツヤツヤすぎる髪、そして、あまりにガッチリした猫を抱きしめる私、というバージョンでした。

大まかなところは合っています。私の顔はまだほとんど私自身に見えますし、猫の毛の模様も大体は維持されています。ソファも色や大まかな形は正しいです。

しかし、ソファのしわや、私のえくぼ、背景のランプ（支柱が2本あるように見える）など、細かな不一致に加えて、私の猫に会ったことがある人なら誰でも、彼女がそんなに大きくないことを知っています。

また、この写真にはAI特有の、まるでワセリンを塗ったような、加工しすぎた見た目があります。

ある程度、これは予想されたことです。私はそれほど多くの写真をアップロードしませんでしたし、AIが提示したポーズで私や猫が写っている写真は1枚もありません。特に私の自撮り写真は顔だけだったので、AIが異なる角度から私たちがどう見えるかを知る方法はありませんでした。

この結果が意味するのは、AIが有用な元情報を使い果たし、シーンがどう見えるべきかを推測する必要に迫られたとき、AIなしでつくられた写真と見分けるのが非常に簡単な、おなじみの問題に今でも直面するということです。

Geminiが生成したいものに近い元写真をアップロードすれば、AI写真をよりリアルにできるかもしれませんが、そうなると、編集プロセスにAIを関与させる意味がどこにあるのか疑問に思ってしまいます。 いずれにせよ、高度なAI編集を説得力のあるものにするには、まだかなりの人間の介入が必要だと自信を持って言えます。

AIと現実の融合に、私たちはどう向き合うべきか

私にとって、Geminiの新しいアップデートがもっとも印象的なのは、小さな修正に使われたときです。そして、まさにそこがPhotoshopへの脅威となるところだと考えています。

私はAI生成写真を見抜くコツを知っているつもりですが、さっとスクロールしただけでは、青いシャツを着た私の画像が、特に警戒心を抱かせるものだとは思わないでしょう。

これは何を意味するのでしょうか？

1つには、無料のAIツールが、以前は手作業で数分かかっていたかもしれないことを、自然言語のプロンプトで実行できるレベルにようやく達したということです。

AdobeはすでにPhotoshopに「nano banana」を組み込む計画を発表していますが、AIの進化に伴い、これまで聖域とされてきたアプリにもさらなる変化が訪れることを覚悟すべきでしょう。少なくとも、些細な修正に関しては、従来のワークフローを本当に脅かす段階に来ています。

コンテンツ制作者ではない一般の人々にとっては、オンライン上の何が本物で何がそうでないかについて、さらに鋭い目を持つ必要が出てくるでしょう。

完全にAIによって捏造された画像は、まだ見分けやすいことが多いですし、より現実的な編集はほとんどが無害なものです（私のシャツの色など誰も気にしないでしょう）。

しかし、Geminiのアップデートにより、現実にほんの少しの嘘を混ぜ合わせることが、これまで以上に簡単になりました。私の言いたいこと、おわかりですよね。これは、新しいGeminiにテイラー・スウィフトが赤い野球帽をかぶっている画像をつくってもらったものです。

この状況がどう展開するかを見守る間、もし画像に警戒心を抱いたなら、覚えておくと良いことがあります。

ウォーターマーク：Geminiは、すべての生成結果の左下にAIウォーターマークを入れています。メタデータ：Geminiを使用して生成された写真は、メタデータにその旨が記録されます。これはiPhoneでもAndroidでも、ダウンロードした写真を上にスワイプすることで確認できます。画像検索：もっとも説得力のある編集は、実際の写真を元にする可能性が高いです（上記のテイラー・スウィフトの例もそうでした）。最後の手段として、Googleの逆画像検索を使って、加工されていない元の画像を探し出すこともできます。

くれぐれも、ネット上での情報にはご注意ください。

著者紹介：Michelle Ehrhardt 「Lifehacker」のテック部門準編集者。アーラム大学で歴史学の学士号を取得し、演劇も専攻。また、ニューヨーク大学（NYU）でゲームデザインの美術学修士号（MFA）を取得している。 ジャーナリストとしてのキャリアは「Out Magazine」からスタートし、LGBTの視点からゲーム、音楽、映画、政治といった分野を取材。 現在は「ニューヨーク・ビデオゲーム批評家サークル」のメンバーであり、ゲームジャーナリズム賞の選考委員も務める。ニューヨークの教育プログラム「DreamYard Program」でのパネルディスカッションやワークショップへの参加経験もあり、「Tom's Hardware Show」やポッドキャスト「Gadgettes」でホストを務めた。 これまでに「Paste」、「The Atlantic」、「Tom's Hardware」、「Gizmodo」、「The Advocate」などのメディアに寄稿。お気に入りの記事として、毎年恒例のCES（コンシューマー・エレクトロニクス・ショー）の総括記事、ビデオゲームのレビュー、ハードウェアメーカーやインディーゲーム開発者へのインタビューなどを挙げている。

GoogleのAIカメラ機能、正直どうよ？テック編集者が感じている本音と懸念 | ライフハッカー・ジャパン

Chromeで「AIが買い物を代行」する日が来るぞ…！一部ユーザー限定で実験中 | ライフハッカー・ジャパン

著者：Michelle Ehrhardt - Lifehacker US

翻訳：ライフハッカー・ジャパン編集部

Image: Google Source: LMArena