By Free-Photos

サンフランシスコ大学の学生2人がSpotifyが公開している各種データセット「Spotify Web API」を利用して、「機械学習によってヒットする曲を予測する」という研究を発表しました。

[1908.08609] Song Hit Prediction: Predicting Billboard Hits Using Spotify Data

https://arxiv.org/abs/1908.08609

Using Spotify data to predict what songs will be hits

https://techxplore.com/news/2019-09-spotify-songs.html

この研究を発表したのは、サンフランシスコ大学で機械学習について学んでいるというKai MiddlebrookさんとKian Sheikさん。2人は一日中音楽を聴いているほどの音楽好きで、ある日音楽について語り合っていたところ、「ヒット曲は似たように聞こえる」という話題が持ち上がりました。2人はこのアイデアを検証するため、Spotifyが「Spotify Web API」の中で公開している、その曲の持つテンポ・キー・曲調(valence)・エネルギー・音響効果の度合(acousticness)・ダンスしやすさ(danceability)・ラウドネスなどを機械学習によって解析し、「ヒット曲の条件を探る」や「どの曲がヒットするかを予測する」といった研究を開始しました。



By diego_cervo

2人はSpotify Web APIで公開されていた180万曲分のデータを、ロジスティック回帰・ニューラルネットワーク・サポートベクターマシン・ランダムフォレストという4種類のアルゴリズムによって分析。曲の各種特徴から「ヒットする」か「ヒットしない」という予測結果を導き出す機械学習モデルをそれぞれ作り上げました。

「ビルボードのヒットTOP100に入った曲を、4種の機械学習モデルでヒットするかを予測する」という検証実験を行ったところ、以下の表のような結果が得られました。評価項目は正確度・精度・再現率の3つで、ランダムフォレストモデルは正確度と精度でそれぞれ88.7%と87%を達成し、ロジスティック回帰モデルは92%以上の再現率を有していました。



Middlebrookさんの説明によると、精度は「『ヒットする』『ヒットしない』という予想のうち何%が実際に正しかったか」を示し、正確度は「全ヒット曲のうち何%を的中させたか」を示すもので、音楽レーベルなどにとっては精度に優れるモデルが最も実用的とのこと。

今回の研究は、「楽曲の特徴に基づいて『曲がヒットするかどうか』は予測可能」だと示したといえます。しかし一方で、Shiekさんは「このヒット曲予想機械学習モデルはレーベルにとって役立つものですが、このモデルに頼りすぎると全ての曲が似通ってくる可能性があります。YouTubeなどは機械学習アルゴリズムを活用して『おすすめ動画』を表示しており、作成したムービーがおすすめ動画に表示されるためには、『画一的な作品でなければならない』という非難があります」と語り、「曲の没個性化」に対する懸念を表明しています。



By Vova Krasilnikov

MiddlebrookさんとSheikさんは、ソーシャルメディアやアーティストの知名度、レーベルなどが「曲がヒットするかどうか」に与える影響を調査する予定だと語っています。