画像生成AI「Stable Diffusion」の開発で知られるAI開発企業のStability AIが、スマートフォンでローカル動作する音楽生成AI「Stable Audio Open Small」を公開しました。Stable Audio Open SmallはArmと協力して開発されており、ArmアーキテクチャのCPUを搭載したスマートフォンで最大11秒の音楽を8秒未満で生成できます。

Today we’re open-sourcing Stable Audio Open Small, a 341M-parameter text-to-audio model optimized to run entirely on @Arm CPUs.



This means 99% of smartphones can now generate music-production samples in seconds, right on-device with no internet required.



Built for fast,… pic.twitter.com/LryqPlfwjj— Stability AI (@StabilityAI) May 14, 2025

Stability AI and Arm Collaborate to Release Stable Audio Open Small, Enabling Real-World Deployment for On-Device Audio Generation - Stability AIStable Audio Open Smallは2024年6月に登場したパラメーター数11億の音楽生成AI「Stable Audio Open」をベースに開発されており、パラメーター数は3億4100万にまで削減されています。また、ArmのAIアクセラレーションライブラリ「Kleidi」を活用することでArmベースのCPUを搭載したスマートフォン上でローカル動作するほどの軽量化を実現しています。スマートフォンでStable Audio Open Smallを実行すると、最大11秒の音楽を8秒以内に生成可能。Stable Audio Open Smallで生成した音楽の例は以下のポストに埋め込まれています。Stable Audio Open Smallのライセンスは「Stability AI Community License」で、非商用なら無料で利用可能。また、年間収益が100万ドル(約1億5000万円)未満なら商用利用でも無料で使えます。Stable Audio Open Smallのモデルデータは以下のリンク先で配布されています。stabilityai/stable-audio-open-small · Hugging Facehttps://huggingface.co/stabilityai/stable-audio-open-smallまた、Armによるドキュメントが以下のリンク先で公開されています。Generate audio with Stable Audio Open Small on LiteRT | Arm Learning Pathshttps://learn.arm.com/learning-paths/mobile-graphics-and-gaming/run-stable-audio-open-small-with-lite-rt