なんでも自動化するGoogleがスゴイ YouTubeのサムネイル自動生成を解説、人工ニューラルネットワーク技術で最適フレームを選択

写真拡大

 
YouTube を楽しむ人にとって、目的の動画を見つけるために重要なのがサムネイル画像。動画の内容を連想しにくいサムネイル画像だったりすると、なかなか視聴回数も伸びないものです。

Google Research Blog が、YouTube 動画のサムネイル画像を自動生成する新しいアルゴリズムの仕組みを解説しています。新アルゴリズムではこれまでにアップロードされた動画のカスタムサムネイルの「クオリティ」を学習し、自動生成する画像の選択に活用しています。
 

【ギャラリー】YouTube thumbnailer (5枚)


 
 YouTube は従来、ユーザーがアップロードした動画からランダムに拾った1コマをサムネイルとして表示していました。しかしもっと動画の視聴回数を稼ごうとするならば、そのサムネイルをひと目見ただけで動画の内容がわかる必要があります。このため、YouTuber などはしっかりと作りこんだカスタムサムネイルを用意し、アップロードした動画に適用しています。

そこで Google は、再生されやすいサムネイルを自動で生成するため、人工ニューラルネットワークの視覚的解析技術を応用した「ディープニューラルネットワーク(DNN)」と称するアルゴリズムを開発、
ユーザーがアップロードした膨大なカスタムサムネイルから再生回数が多くクオリティが高いと思われるもの、またその逆で再生回数・クオリティともに低いと思われるサムネイル画像を大量に分析、学習させました。Google は充分にサムネイルを学習させた新アルゴリズムを使い、今度はサムネイルを生成するための動画を分析しました。毎秒1コマのペースでサムネイル候補となるフレームを抜き出し、そのフレームをサムネイルとした場合の評価をスコア形式で割り振ります。たとえば被写体が動いてぶれていないか、きちんと画像内に収まっているか、構図はどうかといった部分をクオリティとして認識し、それに応じた数値がスコアとなります。候補となるフレームすべてをチェックし終えると DNN は最もスコアが高い1枚を選び出し、それを動画のサムネイルとして表示します。Google によれば、DNN が選びだしたサムネイルと以前のバージョンの生成アルゴリズムが選んだサムネイルを人間が見比べて評価した結果、65%以上の確率で DNN が選んだサムネイルのほうが「クオリティが高い」との評価が得られたとのこと。

Google はすでに YouTube のサムネイラーを DNN 搭載のものに置き換え、稼働させています。これから動画をアップロードするのであれば、自動生成されるサムネイルの傾向が以前のものとどのように変わったか見比べてみると面白いかもしれません。Google はもし新しく生成されたサムネイルが素晴らしいと思ったら迷わず「高く評価(Thumbs up:サムズアップ)」をクリックしてねと呼びかけています。

 

・Google、人工神経ネットワークが見た『夢』を公開 (※ 微グロ注意)