急激なスピードで進化を続ける「人工知能」。とりわけ、生成AIは機能を限定されることなく、幅広い学習ができる汎用性を持つ。はたして、人工知能は人類の知能を超えるほどの能力を獲得したのか? この疑問に答えるため、『知能とはなにか ヒトとAIのあいだ』の著者である田口善弘氏(中央大学理工学部教授)が、生成AIにさまざまな課題にチャレンジさせてみることにした。第3回のミッションは「映画音楽の作曲」。はたしてその出来映えは? 結果は田口氏も驚くものだった。

AIは人類を上回る知能を持つか? 今世紀最大の論点に、機械学習に精通した物理学者が挑む

前回は生成AIが創作したラノベをこれまた生成AIの力で実写化する試みを見せた。十分ではないもののそれなりに将来性を感じてもらえたと思う。

だが、映像作品となったらこれだけでは不十分だ。そう音楽、である。誰しも心の友とでもいうべき何度観ても飽きない映像作品の1つや2つ持っているはずだ。そして、何度も視聴し、暗記するまでになったその作品にはきっと最高のお気に入りシーンがあり、それを心の中で何度も回想するという経験は誰だってあるはずだ。そして、そんな時、無意識のうちに、皆さんの心の中になんらかの音楽が鳴り響いているはずだ。そう、心に残るシーンには音楽が必須なのだ。

かつて映画がトーキー(無音映画)であった時代でさえ、シーンシーンに適した音楽が割り当てられ、ミュージシャンが生演奏を行ったそうである。映像に、効果音も(音声の)セリフさえ無い時代にさえ、すでに音楽は映像作品と共にあった。音楽のない映像なんて魂を抜き取られた屍のようなものだ。

だが、音楽はなんでもいいというわけには行かない。もし、ロマンテックな恋愛シーンに、バトルシーンにふさわしいハイテンポの勇ましい音楽が流れ、一方、バトルシーンには、恋愛シーンにこそ相応しいゆったりとしたムード音楽が流れていたとしたら。「神」作画で声優が「神」演技したとして見るに絶えない駄作になるであろうことは火を見るより明らかだ。

はたして生成AIは、自らが実写化したラノベの映像に、相応しい音楽を作れるだろうか? すでにsunoAIという音楽生成AIは、プロはだしの作曲能力をもっている。しかるべきプロンプトを与えればそれなりの作曲はしてくれるだろう。だが、「バトルシーンに相応しい音楽を」という要望だけではすべてのバトルシーンに同じ調子の音楽が作られることになりかねない。それでは決して良い出来の映像作品はできない。

だが、生成AIはそんな課題さえ解決しつつある。以下は生成AIで作画したラノベの画像を元に、image-to-music-v2というサイト(アプリ)を使って、作曲を行った例である。image-to-music-v2は映像を元にまず作曲に相応しいプロンプトを作成し、そのプロンプトに基づいた作曲が行われる。image-to-music-v2には4種類のAPI(音楽生成ツール)が選べるようになっていたが、原稿執筆時点では2種類のAPIしか使えなかったので各シーン2種類ずつの音楽が作られている。画像から作られたプロンプトには一切手を加えていない。ある程度音楽に素養がある人間が手を加えればもっとよくなることも考えられる。また、英語のプロンプトの和訳はDeepLで機械翻訳をすることで実行した。

読者の皆さんはぜひ、音楽を聞きながらそれぞれのイラストを見て場面にふさわしい音楽が作られているか確認してほしい。

シーン1

"A mellow piano melody with a soft acoustic guitar accompaniment sets the tone for this introspective scene. The rhythm is slow and steady, reflecting the calmness of the night. The music builds with the addition of a haunting violin, capturing the mysterious and dreamy essence of the young woman. The melody fades away, leaving only the sound of the city below, as if the music is a reflection of the woman's inner thoughts and emotions..”

「メロウなピアノの旋律と柔らかなアコースティック・ギターの伴奏が、この内省的なシーンの雰囲気を盛り上げる。リズムはゆっくりと安定し、夜の静けさを反映している。妖艶なヴァイオリンが加わって音楽は盛り上がり、若い女性の神秘的で夢のような本質をとらえる。メロディーは消え、眼下に街の音だけが残り、まるで音楽が女性の内なる考えや感情を映し出しているかのようだ。」

https://youtu.be/kWQ9lcH2pDA?si=tZN-XeuUVy-7HZ5Z

"A gentle piano melody with soft, atmospheric synths and a subtle bassline, building into a dreamy electronic beat as the tempo increases. The overall tone is reflective and introspective, evoking the mood of the young woman lost in thought, surrounded by the peaceful and serene ambiance of the city at night."

「穏やかなピアノの旋律に、ソフトで雰囲気のあるシンセと繊細なベースラインが加わり、テンポが上がるにつれてドリーミーなエレクトロニック・ビートへと発展していく。全体的に内省的で内向的なトーンで、夜の街の平和で穏やかな雰囲気に包まれながら物思いにふける若い女性のムードを喚起する。」

https://youtu.be/uEmt94NcybA

シーン2

“A gentle acoustic guitar melody, accompanied by soft piano notes and the sound of rustling paper, creates a peaceful and reflective atmosphere, reminiscent of a quiet study session in a sun-filled classroom.”

「穏やかなアコースティック・ギターの旋律に、柔らかなピアノの音と紙を揺らす音が加わり、太陽の光が降り注ぐ教室での静かな勉強会を思わせる、平和で内省的な雰囲気を醸し出している。」

https://youtu.be/3d-mX-UAFZs

"A gentle acoustic melody with soft piano and guitar, accompanied by the sound of rustling leaves and bird chirps, creating a peaceful and contemplative atmosphere reminiscent of a morning in a tranquil classroom"

「柔らかなピアノとギターによる優しいアコースティックなメロディーに、葉擦れの音や鳥のさえずりが加わり、静かな教室での朝を思わせる平和で瞑想的な雰囲気を醸し出している。」

https://youtu.be/bWPfQAfHmNA

シーン3

"A dynamic and uplifting synth melody with sweeping pads and soaring strings, evoking the energy and awe of a breathtaking natural phenomenon. The percussion adds a driving pulse, while the soundscapes capture the intensity of the sun's rays against the clouds."

「ダイナミックで高揚感のあるシンセのメロディーに、スウィープするパッドと舞い上がるストリングスが、息をのむような自然現象のエネルギーと畏敬の念を呼び起こす。パーカッションが躍動感を与え、サウンドスケープは雲に照りつける太陽の光の強さを表現している。」

https://youtu.be/nGKja-d5MJc

"A soaring synth melody with pulsating arpeggios, accompanied by a driving beat and sweeping strings, evoking the energy and intensity of a cosmic event, capturing the awe-inspiring beauty of a sunrise over dramatic clouds."

「脈打つアルペジオを伴う高鳴るシンセのメロディーが、ドライヴするビートとスウィープするストリングスを伴って、宇宙の出来事のエネルギーと激しさを呼び起こし、ドラマチックな雲の上に昇る日の出の畏敬の念を抱かせる美しさを捉える。」

https://youtu.be/CKMDPFJw0kg

シーン4

"A gentle acoustic guitar melody with soft piano and strings accompaniment, evoking a sense of tranquility and small-town charm. The occasional sound of a distant car engine and truck rumble adds a subtle layer of realism, while the surrounding mountains are represented by a serene and calming synth pad."

「穏やかなアコースティック・ギターのメロディーに、柔らかなピアノとストリングスの伴奏が、静けさと小さな町の魅力を呼び起こす。時折聞こえる遠くの車のエンジン音やトラックのガタガタ音が微妙なリアリズムのレイヤーを加え、周囲の山々は穏やかで落ち着きのあるシンセ・パッドで表現されている。」

https://youtu.be/mj0v5rcd3s4

"A gentle acoustic guitar melody with a soft piano accompaniment, accompanied by the soothing sound of a stream, creates a tranquil atmosphere reminiscent of a picturesque village at night, with a subtle addition of rustling leaves and distant car sounds to add a touch of realism."

「穏やかなアコースティック・ギターの旋律と柔らかなピアノの伴奏が、心地よい小川の音とともに、絵のように美しい夜の村を思わせる静謐な雰囲気を醸し出し、さざめく木の葉の音や遠くの車の音がさりげなく加わり、臨場感を添えている。」

https://youtu.be/7HJZjwinORk

シーン5

"A haunting melody played by a solo cello in a minor key, with occasional distant whispers of a woodwind ensemble, evoking the foreboding atmosphere of the forest. As the melody builds in intensity, a pulsing rhythm emerges, representing the heartbeat of the portal, leading to a brighter and more uplifting section with a soaring string section, symbolizing the hope and possibility beyond the portal."

「短調のチェロ独奏が奏でる妖しい旋律と、時折遠くから聞こえる木管アンサンブルのささやきが、森の不吉な雰囲気を呼び起こす。メロディーが激しさを増すにつれ、脈打つリズムが現れ、ポータルの鼓動を表す。"ポータルの向こう側にある希望と可能性を象徴する、弦楽器セクションの高鳴りを伴う明るく高揚したセクションへと続く。」

https://youtu.be/AoloRSFiyRQ

"A haunting synthesizer melody with eerie reverb and a pulsing beat, building tension as a lone string quartet enters with a hauntingly beautiful theme. The orchestra swells as the person steps through the portal, revealing a hopeful and uplifting brass fanfare, signifying a new beginning and a brighter future."

「不気味な残響と脈打つビートを伴ったシンセサイザーのメロディーが緊張感を高め、一人の弦楽四重奏が心にしみる美しいテーマで入ってくる。人がポータルをくぐるとオーケストラがうねり、希望に満ちた高揚感のあるブラスのファンファーレが現れ、新たな始まりと明るい未来を意味する。」

https://youtu.be/sESjKrkyeA0

シーン6

"A haunting electronic melody with pulsating arpeggios and ethereal pads, building tension as the boy delves deeper into the unknown digital labyrinth"

「脈打つアルペジオと幽玄なパッドが織り成す妖しい電子メロディが、少年が未知のデジタル迷宮に深く分け入っていくにつれて緊張感を高めていく」

https://youtu.be/5zwwckohLko

"A minimalist electronic soundscape with pulsating arpeggios and intricate rhythmic patterns, building tension and revealing the unknown mysteries of the digital realm."

「脈打つアルペジオと複雑なリズムパターンが緊張感を高め、デジタル領域の未知の謎を明らかにするミニマルなエレクトロニック・サウンドスケープ。

https://youtu.be/iUVfQSsqzls

シーン7

"A soft acoustic guitar melody with gentle strings and a light percussion, building to a crescendo of brushed drums and soft cymbals as the couple's connection deepens under the mystical glow of the full moon. The mood is dreamy and romantic, capturing the essence of their blossoming love."

「柔らかなアコースティック・ギターの旋律に、穏やかなストリングスと軽快なパーカッションが加わり、満月の神秘的な輝きの中で2人の絆が深まるにつれて、ブラシをかけたドラムと柔らかなシンバルがクレッシェンドしていく。夢見るようなロマンティックなムードで、2人の愛の開花のエッセンスを捉えている。」

https://youtu.be/ss-T7rfMWmk

"A gentle acoustic guitar melody with soft piano and strings, building to a delicate crescendo as a cello and violin duet captures the tenderness and longing of this enchanted forest moonlit scene"

「穏やかなアコースティック・ギターの旋律に、柔らかなピアノとストリングスが重なり、チェロとヴァイオリンの二重奏が、この魅惑の森の月夜の情景の優しさと憧れを捉えながら、繊細なクレッシェンドを奏でる。

https://youtu.be/jp-103wuxLY

シーン8

"A delicate acoustic guitar melody with sparse percussion, evoking a wistful and nostalgic mood, reminiscent of simpler times in a rural setting."

「繊細なアコースティック・ギターの旋律とまばらなパーカッションが、田舎の素朴な時代を思わせる、切なくノスタルジックなムードを呼び起こす。

https://youtu.be/yG10rWIbi2g

"A slow acoustic guitar melody with gentle piano accompaniment and a subtle violin solo, capturing the melancholic longing of a rural love story"

「ゆったりとしたアコースティック・ギターの旋律に、優しいピアノ伴奏と繊細なヴァイオリン・ソロが、田舎のラブストーリーのメランコリックな憧れを表現している。

https://youtu.be/2detD98qzLI

さて、どうだっただろうか? 僕は音楽にはからっきし疎いので出来栄えの判断はできないが、シーン8の一番目の音楽など、これでさらに画面上にエンドスクロールでも流れていたら「出会った少年にほのかな恋心を抱き始めた若い女性の切ない想いを描いたエンディグ」としてかなりのできなのではないか、と思ってしまった。

作成されたプロンプトを見ても「ラブストーリー」とか「2人の愛の開花のエッセンス」のようなワードが散見され、それがどれくらい作曲の役にたっているかはわからないものの、なんの説明もないのに、生成AIがイラストの裏にある登場人物の心理描写までやってのけている様子が散見されたのには驚いた。

すでに上述のsunoAIは画像から音楽を作るSunoScenesをアメリカではリリース済みであるという。実際にそれを使える日がいまから楽しみだ。

拙著『知能とはなにか』では、なぜ生成AIがこのようなことができるようになったのか、を平易に解説している。将来、人工知能は、人類を上回る知能を獲得することができるのか。本書を読めば、生成AIをめぐる混沌した状況が鮮やかに整理できるはずだ。

『「生成AIで作ったラノベ」を原作に「生成AIでつくった実写映画」を「生成AIにアフレコ」させてみた結果』の記事に続きます。

「生成AIで作ったラノベ」を原作に「生成AIでつくった実写映画」を「生成AIにアフレコ」させてみた結果