入力してテキストに応じて高解像度の動画を出力する生成AI「Veo」を、Googleが「Google I/O 2024」で発表しました。

Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools

https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/

発表があったのは基調講演の33分53秒あたりから。Google DeepMindのデミス・ハサビス氏が解説しています。

Google Keynote (Google I/O ‘24) - YouTube

Googleによれば、Veoは自然言語と視覚的な意味情報を深く理解することにより、たとえば「タイムラプス」や「空撮映像」といったプロンプトを入力すれば、それぞれ意図したような映像を作成してくれるとのこと。映像の解像度は1080pで、1分を超える映像の出力も可能です。

以下は「『Veo』が生成した動画」としてGoogleが公開した映像。いっさい手は加えていないそうです。

Googleの動画生成AI「Veo」が生成した動画 - YouTube

生成AIに興味を持ってGoogleに連絡を取ったという、俳優であり映画プロデューサーなどとしても活躍するドナルド・グローヴァー氏が、実際にVeoを使って作品作りに取り組んだという様子も公開されています。

Filmmaking with Donald Glover and his creative studio, Gilga | Veo - YouTube

Veoの実現にあたっては、Generative Query Network(GQN)やDVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet、Lumiereといった、過去の生成動画AIモデル研究の成果が発揮されているとのこと。

そしてさっそく、「Veo」を用いた動画生成ツール「VideoFX」と画像生成・編集ツール「ImageFX」、音楽制作ツールの「MusicFX」が公開されています。なお、責任を持ってツールや技術を開発するというGoogleのポリシーに従い、VideoFX、ImageFX、MusicFXで制作されたコンテンツにはSynthIDによる電子透かしが施されるとのことです。

Labs: Sign up for VideoFX and see updates to MusicFX, ImageFX

https://blog.google/technology/ai/google-labs-video-fx-generative-ai/



VideoFX、ImageFX、MusicFXは「http://labs.google/」で試用可能です。

◆フォーラム開設中

本記事に関連するフォーラムをGIGAZINE公式Discordサーバーに設置しました。誰でも自由に書き込めるので、どしどしコメントしてください!Discordアカウントを持っていない場合は、アカウント作成手順解説記事を参考にアカウントを作成してみてください!

• Discord | "OpenAIとGoogleの動画生成AI、どっちが勝ちそう?" | GIGAZINE(ギガジン)

https://discord.com/channels/1037961069903216680/1240234713520668672