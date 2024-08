NVIDIAから流出した社内文書やチャットの内容から、NVIDIAのチームがAIの訓練のためにYouTubeやNetflixの動画を1日当たり80年分ダウンロードすることについて検討していたことがわかりました。YouTubeの動画を著作権者の許可なくダウンロードすることは利用規約で明確に禁じられていますが、規約に違反していることを知った上でダウンロードしていたのか、はたまた特別な許可を得ていたのかは明らかになっていません。

Leaked Documents Show Nvidia Scraping ‘A Human Lifetime’ of Videos Per Day to Train AIhttps://www.404media.co/nvidia-ai-scraping-foundational-model-cosmos-project/海外メディアの404 Mediaが入手したNVIDIAの社内Slackチャット、電子メール、文書によると、NVIDIAはOmniverse 3Dワールドジェネレーターや自動運転車システム等のAIモデルを訓練するため、YouTubeやNetflix、その他のソースから動画をスクレイピングするよう、従業員へ指示したとのこと。このプロジェクトは社内で「Cosmos」と名付けられ、その成果はまだ一般には公開されていません。なお、既存の「Cosmos Deep Learning」というクラウドサービスとは異なるものだそうです。NVIDIAがプロジェクト用に開設したチャンネル内のSlackメッセージには、従業員がオープンソースのYouTube動画ダウンローダーである「yt-dlp」を使用し、YouTubeにブロックされないようにIPアドレスをリフレッシュする仮想マシンと組み合わせて使用するなどのやりとりが交わされているとのこと。従業員らはNetflixを含むさまざまなソースから動画をダウンロードしようとしていましたが、基本的にはYouTubeに注力していて、プロジェクトマネージャーたちはAmazon Web Servicesの20〜30台の仮想マシンを使って1日あたり80年分の動画をダウンロードすることについて話し合っていたと404 Mediaは伝えました。AIモデルの学習に著作権で保護されたコンテンツを使用することの法的・倫理的側面について従業員が疑問を投げかけた際、NVIDIAの管理職は「会社の最高レベルからそのコンテンツの使用許可を得ている」と話したとされています。NVIDIAの広報担当者は404 Mediaに対し、「我々はすべてのコンテンツ制作者の権利を尊重しており、我々のモデルと研究努力は著作権法の文言と精神を完全に順守していると確信しています。著作権法は特定の表現を保護しますが、事実、アイデア、データ、情報を保護するものではありません。事実、アイデア、データ、または情報を他の情報源から学び、それを使って独自の表現をすることは自由です。AIモデルの訓練のような目的のために作品を使用する能力を保護する『フェアユース』という概念もあります」と述べたそうです。NVIDIAがモデルの訓練データとしてYouTubeの動画を使用していることについてコメントを求められたGoogleの広報担当者は、404 Mediaに対して「以前の声明はまだ有効である」と述べ、YouTubeのニール・モーハンCEOがAIの訓練について語ったBloombergの記事を書き添えたとのことです。YouTubeのCEOが「AIのトレーニングへの利用はルール違反」「大事なのはクリエイターがYouTubeで成功すること」と語る - GIGAZINENetflixの広報担当者は404 Mediaに対し、Netflixはコンテンツの取り込みに関してNVIDIAと契約しておらず、プラットフォームの利用規約でスクレイピングは認めていないと述べました。