AI開発企業のAnthropicが、AIチャットボット「Claude」のトレーニングに著作権で保護された数十万冊もの書籍を不正に使用したとして、3人のアメリカ人作家に提訴されました。

Authors vs Anthropic - DocumentCloud

https://www.documentcloud.org/documents/25052247-authors-vs-anthropic

Authors sue Anthropic for copyright infringement over AI training | Reuters

https://www.reuters.com/technology/artificial-intelligence/authors-sue-anthropic-copyright-infringement-over-ai-training-2024-08-20/



Authors sue Anthropic for training AI using pirated books - The Verge

https://www.theverge.com/2024/8/20/24224450/anthropic-copyright-lawsuit-pirated-books-ai

今回、Anthropicを訴えたのはジャーナリストで作家のアンドレア・バーツ氏、チャールズ・グレーバー氏、カーク・ジョンソン氏の3名です。

訴状の中で原告は、Anthropicが「The Pile」と呼ばれるオープンソースデータセットを使用してClaudeのトレーニングを行ったと主張。「The Pile」には村上春樹氏の小説やスティーヴン・キング氏の作品など約19万6640冊分のデータが入った「Books3」が含まれています。

AIのトレーニングモデルを分析したら数千人の有名作家の本を含む約20万タイトルが確認されるも、トレーニングに使われたスティーヴン・キングは「AIを恐れていない」と発言 - GIGAZINE



2024年8月にAnthropicは海外メディアのVoxに対して、「The Pile」を利用してClaudeのトレーニングを実施したことを認めています。

バーツ氏らは「AnthropicがThe PileとBooks3のコピーをダウンロードして複製したことは明らかです。Anthropicはこれらのコンテンツが著作権で保護されたコンテンツの海賊版であることを知りながらClaudeのトレーニングを行っていました」「Anthropicは著作権で保護された素材を利用することで数十億ドル(数千億円)にも上る莫大な金銭的利益を享受しています。Anthropicの商業的利益は、クリエイターと権利者を犠牲にして成り立っています」と主張。

バーツ氏らはAnthropicに対し損害賠償の支払いを求めるとともに、今後Anthropicが著作権で保護されたコンテンツを使用しないことを要求しています。



Anthropicは今回の訴訟に対し、提訴されたことは認めたものの、係争中であることを理由にさらなるコメントを控えました。

これまでにもAnthropicは、Claudeのトレーニングに著作権で保護された500曲以上の歌詞を不正に使用したとしてUniversal Musicに訴えられています。