AIの台頭により、コンテンツを生み出す出版社はAIと共存するか対決するかの選択を迫られています。アメリカの大手出版社のペンギン・ランダムハウスが、今後出版される書籍をAIのトレーニングに使用することを明示的に禁止する措置を講じると、イギリスの出版業界メディア・The Booksellerが報じました。

The Bookseller - News - Penguin Random House underscores copyright protection in AI rebuff

https://www.thebookseller.com/news/penguin-random-house-underscores-copyright-protection-in-ai-rebuff

Penguin Random House books now explicitly say ‘no’ to AI training - The Verge

https://www.theverge.com/2024/10/18/24273895/penguin-random-house-books-copyright-ai

伝えられるところによると、ペンギン・ランダムハウスは世界中で出版される新刊と再版本の著作権表記のページを改訂し、大規模言語モデル(LLM)を含むAIによるトレーニングへの使用を禁止することを明言する文言を挿入するとのこと。

新しい著作権表記のページには「本書のいかなる部分も、AI技術またはAIシステムのトレーニングの目的で、いかなる方法においても使用または複製することはできません」と書かれます。



The Booksellerによると、著作権のページでAIに言及した大手出版社はペンギン・ランダムハウスが初めてだとのことです。

また、EUのデジタル単一市場における著作権に関する指令(CDSM指令)に基づき、「この作品をテキストおよびデータマイニングの例外から明示的に留保します」との表記も追加されます。

従来のEUの規則では、著作権者の許可を得ることなく著作物を使用できる例外的な用途として教育や報道などが規定されていましたが、2019年に採択されたCDSM指令によりそれらの用途に「テキストおよびデータマイニング(TDM)」が追加されました。

これにより、学術研究などの目的で著作物を自由にTDMに使用することが可能になるのと同時に、著作権者は特定の著作物を「例外から明示的に留保する」と宣言することで、当該作品を例外規定から除外し、無許可でTDMに使うことを禁止できるようになりました。



とはいえ、今回の変更の実効性については疑問の声も出ています。The Booksellerの報道を取り上げたIT系ニュースサイトのThe Vergeは、ウェブサイトが「robots.txtファイル」でコンテンツをAIトレーニングに使用しないように要請してもしばしば無視されることを引き合いに出して、「今回の改訂は『ペンギン・ランダムハウス版robots.txt』のようなもので、警告にはなるかもしれませんが実際の著作権法とはほとんど関係ありません。著作権ページが本の冒頭に挿入されているかどうかにかかわらず著作権は保護されるし、権利者が認めるかどうかにかかわらずフェアユースなどの名目で勝手に利用される可能性があるからです」と述べました。

出版社が書籍のAIへの使用を明確に拒否する姿勢を打ち出すのは、AIが既に大量の海賊版の本でトレーニングされているとの実態が報じられる中、オックスフォード大学出版局などの著名な出版社がAI企業にライセンスを供与する方針を示すなど、せめてAIによる使用から正当な対価を得る方法を模索しようとする動きに逆行するものであると、指摘されています。

その一方で、複数の作家や大手メディアが、コンテンツをAIのトレーニングに無断使用するのは著作権の侵害であるとしてAI企業を提訴しており、AIへの対応をめぐって業界は大きく二分されています。

MicrosoftとOpenAIが著作権侵害で新聞社8社から訴えられる - GIGAZINE



今回の決定に先立ち、ペンギン・ランダムハウスは2024年8月に「人間の創造性を擁護すること」「著者やアーティストに属する知的財産を積極的に保護すること」「責任を持って生成AIツールを使用すること」を宣言する三原則を発表していました。

Fox Williams法律事務所の著作権弁護士であるChien‑Wei Lui氏は、「AIが著作物の複製や著作権の侵害にあたる出力を生成する可能性は極めて低いものの、LLMによるトレーニングはそれ自体が侵害行為ですので、出版社は自社と著者の利益のためにそのような行為をコントロールできるようにすべきです。生成AIの加速は出版業界にとって存続にかかわる問題になりつつありますが、より地に足の付いた懸念は、コンテンツが同意なしにトレーニングに使われれば、出版社と著者の両方が収益を逸失するということでしょう」とコメントしました。