「YouTubeのショート動画が投稿者の許可無くAI処理され、見た目が変化する」という事態が発生していることが明らかになりました。YouTubeはショート動画への処理を認めており、処理内容を説明しています。

YouTube Shorts are almost certainly being AI upscaled : r/youtube

https://www.reddit.com/r/youtube/comments/1lllnse/youtube_shorts_are_almost_certainly_being_ai/

以下の画像は左側が通常のショート動画で、右側がAI処理の施されたショート動画です。左右を見比べると、左側の方がメガネの輪郭や耳の凹凸、服の柄などがクッキリと描写されていることが分かります。なお、画像をクリックすると大きな画像を確認できます。



「AI処理済みの240p動画」「AI処理済みの360p動画」「AI処理済みの480p動画」「AI処理済みの720p動画」「オリジナル動画」「AI処理済みの1080p動画」を並べるとこんな感じ。オリジナル動画では耳がぼやけた感じになっていますが、480p以上のAI処理済み動画では耳がクッキリしています。つまり、AI処理済みの動画はオリジナルを復元しているというわけではなく、オリジナル動画にはない情報を勝手に計算して補っているというわけです。



AI処理済み動画は肌の質感がのっぺりしていることや、輪郭がクッキリしすぎていることから「動画生成AIで作られた動画のように見える」とも指摘されています。以下のXユーザーはAI処理済み動画について「YouTubeはショート動画を加工してAIっぽく見えるようにしています。これは意図的かつ悪意のあるものです。AI処理機能が正式リリースされれば、視聴者は低品質なAIコンテンツ(Al-slop)とそうでないコンテンツを見分けるのが難しくなり、AIコンテンツが良いものだと感じるようになるでしょう」と述べ、YouTubeの行為を痛烈に非難しています。





YouTube社員のレネ・リッチー氏は上記のポストに反応する形で「生成AIもアップスケーリングも使っていません。私たちは一部のYouTubeショート動画を対象に機械学習技術を用いてボケ軽減やノイズ軽減、鮮明度向上などの加工を行っています。これは最近のスマートフォンの動画撮影機能のようなものです」と説明しています。





さらに、リッチー氏は「技術オタクとして正確な用語を使うように心掛けています。生成AIはTransformersや大規模言語モデルのような比較的新しい技術を指します。アップスケーリングは低解像度(480pなど)のコンテンツを高解像度(1080pなど)に拡大する技術を指します。YouTubeショートでは生成AIもアップスケーリングも使っておらず、スマートフォンのカメラ機能に備わっているような機械学習技術を用いています」と述べ、あくまで従来の機械学習に基づく動画鮮明化技術を適用しているのみで、生成AIを用いた編集は施していないと強調しています。





しかし、リッチー氏の投稿には「(機械学習だろうと)AIであることには違いありません」「私は自分のコンテンツにYouTubeの金銭的利益を目的として機械学習技術が使われることを望んでいません。オプトアウトする方法を教えてください」という返信が寄せられています。





なお、ショート動画に対するAI処理は一部の動画に対するテストが実施されている段階で、正式リリース時期は不明です。