Alibabaが動画生成AI「Wan」のスマートフォン向けアプリをリリースしました。アプリではテキストや画像を入力して動画を生成可能で、動画の共有機能なども搭載されています。すでに日本のiPhoneやAndroidスマートフォンでも無料で利用可能だったので、実際に使ってみました。





Wanアプリ - App Store

https://apps.apple.com/jp/app/wan/id6753616942

Wan - Google Play のアプリ

https://play.google.com/store/apps/details?id=com.aliyun.wan.android&hl=ja_JP

今回はiOS版のWanを使ってみます。上記のリンクをタップして配布ページにアクセスしてから「入手」をタップ。



インストールが完了したら「開く」をタップ。



Wanが起動したら下部中央のボタンをタップします。



動画を生成するには「Appleアカウント」「Googleアカウント」「GitHubアカウント」「任意のメールアドレスで作成したアカウント」のいずれかでサインインする必要あり。今回はメールアドレスを入力して新規アカウントを作成します。まず、画面右下のメールボタンをタップ。



「Sign up」をタップ。



上から順に「アカウント名」「メールアドレス」「パスワード」を入力し、確認用に同じパスワードを再度入力してから「Continue」をタップ。



入力したメールアドレスに6桁の確認コードが届くので、コードを入力して「Continue」をタップ。



アカウント作成が成功して150クレジットが付与されました。「Check In」をタップして次の画面に進みます。



画面下部の入力欄をタップ。



初回は「Role」の登録を求められます。Roleは顔写真や声などを登録して自分を動画に登場させられる機能です。今回はRole機能を使わないので×ボタンをタップしました。



動画作成画面はこんな感じ。中央の入力エリアに生成した動画の説明文を入力可能で、下部には動画の設定エリアが配置されています。



今回はぬいぐるみの写真を入力して「ぬいぐるみがダンスする動画」を作ってみます。まず、「Generate」をタップしてから「Image」をタップ。



「Use camera」をタップ。



カメラの使用許可を求められたら「許可」をタップ。



ぬいぐるみの写真を撮影。



「Use Photo」をタップ。



「A plush toy dances dynamically with rock music.(ロック音楽が流れる中でぬいぐるみが踊る)」と入力してから右下のボタンをタップ。



生成が始まりました。生成処理はサーバーで実行されるのでスマートフォンの性能が低くても問題ありません。



1分程度で動画が完成。動画を再生するにはサムネイルをタップすればOKです。



動画をダウンロードしたいので左下のメニューボタンをタップ。



「Download」をタップ。



ダウンロードした動画をYouTubeに投稿してみました。指示通りにぬいぐるみがロック音楽の中で踊っています。

動画生成AIアプリ「Wan」で生成した720p動画 - YouTube

初期設定だと長さ5秒の720p動画を生成できます。動画の説明文を入力する際に「Generate」をタップすると画面下部のキーボードが消えて長さや解像度の設定エリアが表示されます。



解像度は「720P」か「1080P」から選択でき、長さは「5秒」「10秒」「15秒」から選べます。解像度や長さに応じて消費クレジットが増減する仕組みです。1080Pの10秒動画を生成する場合は30クレジットを消費します。



「A stuffed toy stands up and waves his hand and says, "This AI is wonderful."(ぬいぐるみが立ち上がって手を振って『This AI is wonderful.』としゃべる)」というプロンプトで生成した10秒の1080P動画が以下。発話と口の動きが合致しています。

動画生成AIアプリ「Wan」で生成した1080p動画 - YouTube

なお、AlibabaはWanに入力する説明文のコツを解説するページも公開しています。