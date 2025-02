複数のアメリカ人作家が2023年にOpenAIやMetaを著作権違反で提訴した裁判で、Metaは「AIのトレーニング目的で海賊版書籍のデータセットをトレントでダウンロードしたこと」を認めました。しかし、Metaは「ダウンロード後にそのファイルを共有した証拠はない」と裁判で主張しています。Meta Says it Made Sure Not to Seed Any Pirated Books * TorrentFreak

https://torrentfreak.com/meta-says-it-made-sure-not-to-seed-any-pirated-books/Meta claims torrenting pirated books isn’t illegal without proof of seeding - Ars Technicahttps://arstechnica.com/tech-policy/2025/02/meta-defends-its-vast-book-torrenting-were-just-a-leech-no-proof-of-seeding/2023年、コメディアンで作家でもあるサラ・シルバーマン氏を含む3人の作家は、ChatGPTとLlamaが違法にインターネット上に流通している作品をデータセットとしてトレーニングされたものであると主張し、OpenAIとMetaを提訴しました。OpenAIとMetaが著作権侵害で3人の作家から訴えられる - GIGAZINEこの裁判で、Metaは海賊版電子書籍ライブラリのZ-LibraryやAnna's Archiveなどに保存された約82TBのデータを用いてトレーニングを行ったという証拠が提示されました。Metaのマーク・ザッカーバーグCEOがAI「Llama」の開発チームに対し著作権で保護された作品の無断使用を許可したと訴訟で追及される - GIGAZINEこのトレーニング用のデータセットはMeta社内でBitTorrentを使ってダウンロードされたと見られており、原告は「BitTorrentを使ったダウンロード行為そのものが、カリフォルニア州のコンピューターデータアクセス詐欺防止法(CDAFA)に違反する行為だ」と主張しました。一方、Metaは「BitTorrent自体は大きなファイルをダウンロードするために広く使用されているプロトコルであり、違法な技術ではない」と反論。今回のBitTorrent使用によるデータダウンロードは、単に「BitTorrent経由で公開されている『有名なオンラインリポジトリ』のデータにアクセスするための動き」だったと述べ、ダウンロードする行為自体は違法ではないと説明しました。また、Metaはあくまでも「データのダウンロードは行ったが、ダウンロードしたデータを共有する『シーディング』については証拠がなく、否定する」という姿勢を示しています。IT系ニュースサイトのArs Technicaは、Metaが「海賊版(pirate)」という言葉の使用を意図的に避けており、代わりに「公開されていたデータセット」「誰でも読める出版された書籍のテキスト」「原告が運営・所有していない公開されたウェブサイト」といった表現を用いることで、自社の行為を合法的な範囲内のものとして再定義しようとしていると指摘しています。しかし、Metaのプロジェクト管理責任者であるマイケル・クラーク氏は、同社がシーディングされる数をを可能な限り最小限にするように設定を変更したと認めています。これは、シーディングを完全に防いだのではなく、一定量はシーディングを行っていた可能性があり、原告側は「BitTorrentを使用した時点で、Metaは海賊版のデータを世界中のユーザーが利用できるようにした」と主張しました。さらに、Metaの内部メッセージでは、同社がFacebookのサーバーを使用せずにデータセットをダウンロードしたことが明らかになっており、これは追跡リスクを避けるための意図的な試みだったと原告側は主張しています。最終的に原告側は、MetaがBitTorrentを使って「海賊版データベースから作品を入手した」ことでライセンス収入を失っただけでなく、Metaが「AI訓練のためにデータを取得する過程で、世界中のインターネットユーザーが作品の海賊版データをダウンロードできるようにした」ことで追加収入も失ったと主張しています。