xAIが動画生成AI「Grok Imagine 1.0」をリリース、GoogleのVeo 3.1を超える性能

xAIが動画生成AI「Grok Imagine 1.0」を2026年2月2日にリリースしました。Grok Imagine 1.0は最大10秒の720p動画を生成可能です。
Introducing Grok Imagine 1.0, our biggest leap yet.
1.0 unlocks 10-second videos, 720p resolution, and dramatically better audio.
Imagine has generated 1.245 billion videos in the last 30 days alone.
Try it now: https://t.co/zGhs9czkC5 pic.twitter.com/7FPxm7H059— xAI (@xai) February 2, 2026
Grok Imagine 1.0は「テキストからの動画生成」と「画像からの動画生成」に対応しています。音声も同時に生成可能で、これまでより高品質な音声付き動画を出力できるようになりました。以下のポストに含まれている動画を再生すると、感情豊かな音声を作り出せることが分かります。
We’ve dramatically improved audio. Hear characters speak with emotional and expressive voices. Add immersive music that syncs perfectly to the scene. pic.twitter.com/MitGAqHLgw— xAI (@xai) February 2, 2026
AIの性能をモデル名を伏せた状態で人間に評価させるArtificial Analysisのテストでは、テキストから動画を生成するカテゴリにおいてGrok ImagineがGoogleのVeo 3.1やOpenAIのSora 2 Proといった高性能モデルを超える性能を示してランキング1位となっています。

画像から動画を生成するカテゴリでもGrok Imagineが1位です。

一方で、同様のテストを実施しているArena(旧称:LMArena)のテキストから動画を生成するカテゴリではVeo 3.1やSora 2 Proに負けて4位でした。

画像から動画を生成するカテゴリでは3位です。

Grok ImagineはGrokアプリやAPI経由で利用可能です。
Grok Imagine API | xAI
https://x.ai/news/grok-imagine-api
