YouTubeチャンネル「AI大学【AI&ChatGPT最新情報】」が「【無料の音楽生成AI】自分のパソコンで動かせる、Sunoクラス？の音楽生成AI「ACE-Step 1.5」の使い方！」と題した動画を公開した。



動画では、2月上旬に公開されたオープンソースの音楽生成AIモデル「ACE-Step 1.5」について、その概要から具体的な使用方法までを解説している。ACE StudioとStepFunが開発したこのモデルは、テキストから歌唱入りの楽曲を生成できるもので、日本語を含む50以上の言語に対応している点が特徴だ。このモデルの最大の強みとして「個人向けPCの一般的なGPUでも動作し、なおかつ現時点で最高峰の性能を誇る」点も挙げられている。



動画内で示されたベンチマーク結果によると、ACE-Step 1.5はオープンソースモデルの中で最高評価を獲得しているだけでなく、商用の音楽生成AIとして有名な「Suno」と比較しても遜色ない性能を示しているという。具体的には、楽曲のスタイルと歌詞の一致度などを測る指標において高いスコアを記録し、人間の評価者による比較テストでは「Suno v4.5とSuno v5の間に位置する」品質だと評価された。また、NVIDIAの一般的なGPUであるRTX 3090を使用した場合、1曲あたり10秒未満で生成可能であり、VRAMが4GB未満の環境でも動作するという軽量性も魅力の一つだ。



動画では、実際にこのAIを利用するための3つの方法が紹介されている。1つ目は「Hugging Face」上で公開されている公式デモを利用する方法で、ブラウザから無料で手軽に楽曲生成を試すことができる。2つ目は「WaveSpeed AI」というプラットフォームを利用する方法、そして3つ目は自分のPCにインストールして利用する方法だ。特にローカル環境への導入については、Windowsユーザー向けに用意された「ポータブルパッケージ」を使用することで、環境構築の難易度を下げられると説明している。



最後に、実際に生成されたJ-POPやロック、演歌などの楽曲を流しながら、その品質の高さが実証された。商用サービスに匹敵するクオリティの音楽生成AIがオープンソースで提供され、個人のPC環境でも自由に扱えるようになったことは、クリエイターにとって大きな福音と言えるだろう。