Googleが最大4Kの動画を生成できるAI「Veo 2」を発表、人間による評価でOpenAIのSoraを上回る

Googleが2024年12月16日に動画生成AIの「Veo 2」を発表しました。最大4Kまでの解像度の動画を作成できるほか、実写風動画以外にアニメ調の動画を作成可能で、カメラに対する指示も忠実に反映できると述べられています。
Veo 2 - Google DeepMind
https://deepmind.google/technologies/veo/veo-2/
Updates to Veo, Imagen and VideoFX, plus introducing Whisk in Google Labs
Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥
We’re also releasing an improved version of our text-to-image model, Imagen 3 - available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4— Google DeepMind (@GoogleDeepMind) 2024年12月16日
Introducing Veo 2, our new, state-of-the-art video model (with better understanding of real-world physics & movement, up to 4K resolution). You can join the waitlist on VideoFX. Our new and improved Imagen 3 model also achieves SOTA results, and is coming today to 100+ countries… pic.twitter.com/FtwNKyicEc— Sundar Pichai (@sundarpichai) 2024年12月16日
2024年5月にGoogleは動画生成AIとして「Veo」を発表していました。前バージョンであるVeoで作成できる動画の解像度は1080pまででしたが、Veo 2では4K解像度に対応。リアリティなど品質も向上しています。
自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表 - GIGAZINE

公式の作例はこんな感じ。被写界深度を適切に理解し、背景をぼかして顔にフォーカスを当てた動画を作成できています。
Veo demo | Cartoon girl - YouTube
ホットケーキに蜂蜜をかける動画では、蜂蜜の動きをきれいに生成することに成功。後半のコーヒーを注ぐシーンは本物なのかAIによる生成物なのかを見分けるのは難しそうです。
Veo demo | Pancakes - YouTube
以下の動画は養蜂家が蜂蜜を手に取るシーン。実写との区別はほとんどつきません。
Veo demo | Beehive - YouTube
人間の評価者による他の動画生成モデルとの比較結果はこんな感じ。1003個のプロンプトを元にそれぞれのAIで動画を作成し、人間が「どちらの動画が優れているか」を評価しました。比較対象は「Meta Movie Gen」「Kling v1.5」「Minimax」「Sora Turbo」の4つ。いずれとの比較でもVeo 2の方が高い評価を獲得しています。

「どちらの動画がよりプロンプトと一致しているか」という軸で評価してもVeo 2の方が高い評価を獲得しました。

Veo 2が生成する動画には目に見えない透かしであるSynthIDが含まれており、AIによる生成物かどうかを見分けられるようになっているとのこと。発表と同時にVideoFXで一部のユーザーを対象にVeo 2が利用可能になっています。今後アクセスできるユーザーの数を増やしていく予定です。
すでにXにはユーザーによる多数の作例が投稿されています。
Veo 2 imagines neurips parties in the future ;) pic.twitter.com/NqxUyU669w— Dumitru Erhan (@doomie) 2024年12月16日
A monkey and a potato riding a bike under water surrounded by colorful fish and sharks. #veo2 pic.twitter.com/pwQi7U4BhP— Ruben Villegas (@RubenEVillegas) 2024年12月16日
"A pair of hands skillfully slicing a ripe tomato on a wooden cutting board"#veo pic.twitter.com/VDuxnkvIa0— Agrim Gupta (@agrimgupta92) 2024年12月16日
Capybara gymnastics ✅
Generated with #Veo2 pic.twitter.com/nbw5euLZis— Thomas Kipf (@tkipf) 2024年12月16日
Generated with #Veo2 pic.twitter.com/cgbOpaFVpR— Shlomi Fruchter (@shlomifruchter) 2024年12月16日
A broccoli wearing a leather jacket and carrot wearing a tank top having a steak dinner #veo2 pic.twitter.com/T4RgKjeeN1— Ruben Villegas (@RubenEVillegas) 2024年12月16日
Veo v2 generates a meeting of animals #Veo2
Prompt: A meeting of a lion, a bear and a giraffe, all of them wearing suits. Photorealistic, cinematic. pic.twitter.com/626pv15PSG— Hernan Moraldo (@hhm) 2024年12月16日
Google Veo 2.
Prompt: A bartender making an old-fashioned cocktail.
Text2Video. Two variations. #VideoFX #Veo2 @GoogleDeepMind pic.twitter.com/QdCjazGsw1— Dave Clark (@Diesol) 2024年12月16日
Google is so back 🔥🔥
They just announced Veo 2, an AI video generation model, and it’s incredible.
They’ve also updated the Imagen 3 image-generation model.
10 examples below 👇 pic.twitter.com/adP4syE0VF— AshutoshShrivastava (@ai_for_success) 2024年12月16日
the sweater frogs can moooove #veo2 pic.twitter.com/mtB5MqLl1W— Ben Poole (@poolio) 2024年12月16日
Just got access to Veo 2 on AI Test Kitchen! Results look amazing#VideoFX #Veo2 pic.twitter.com/4rQGgWi0vQ— Dylan Neve (@DylanNeve10) 2024年12月16日
Soccer from the future, according to Veo 2 #veo2 pic.twitter.com/9ROFtvrgMb— Hernan Moraldo (@hhm) 2024年12月16日
"An astronaut exploring an underwater alien shipwreck."#veo2 pic.twitter.com/oTz4h03XjE— Gabriel Barth-Maron (@gbarthmaron) 2024年12月16日
I love the synchronization of the flowers with the walk #veo2 pic.twitter.com/Kq1vDhXZwo— Dumitru Erhan (@doomie) 2024年12月16日
The physics understanding with Veo 2 is insane.
Prompt : "A man jogging on a treadmill" https://t.co/sUXLemuVhQ pic.twitter.com/YtF7oPsFN8— AP (@angrypenguinPNG) 2024年12月16日
