自分たちの書籍が同意なくAIのトレーニングに使われたとして、サラ・シルバーマン氏を含む3人の作家がOpenAIを訴えた裁判で、原告らが厳重な警備のもとでAIのトレーニングに使われた資料を精査することが認められたことがわかりました。

OpenAI Training Data to Be Inspected in Sarah Silverman Copyright Case

https://www.hollywoodreporter.com/business/business-news/openai-training-data-inspected-authors-copyright-case-1236011291/

コメディアンで作家のサラ・シルバーマン氏を含む著名な作家らは2023年に、著作権違反でOpenAIやMetaを提訴しました。しかし、複数の訴訟のうちOpenAIを相手にした裁判の前半戦では、シルバーマン氏らの主張のほとんどが裁判所に棄却されるなど、原告にとって苦しい展開となりました。

ChatGPTに対する著作権侵害訴訟の前半戦でOpenAIがほぼ全面勝利、作家3人の訴えの大半が却下される - GIGAZINE



シルバーマン氏らの訴因は大きく分けて「直接的な著作権侵害」「間接的な著作権侵害」「デジタルミレニアム著作権法(DMCA)違反」「カルフォルニア州不公正競争法(UCL)違反」「過失」「不当利益」の6つですが、このうち「UCL違反」と「直接的な著作権侵害」以外の4つは2024年2月に却下されています。

これを受けて、作家側は「著作権で保護された著作物を許可なく使用してAIを訓練したのは、カリフォルニア州の州法で禁止されている『不公正な商慣行』に該当する」と訴えました。

しかし、カリフォルニア地方裁判所のアラセリ・マルティネス・オルギン判事は2024年7月の判決で、「侵害を受けたとされているのは著作権で保護された著作物であり、そのような訴えは州法の適用外なので、国の著作権法で処理されるべきである」として、UCL違反との訴えも棄却しました。

これにより、OpenAIを相手にした今回の訴訟でシルバーマン氏らに残されたカードは「直接的な著作権侵害」のみとなりました。

そして、9月24日に裁判所に提出された書類で、シルバーマン氏らがデータの検査手順について合意したことが明らかになりました。OpenAIはこれまで、ChatGPTのトレーニングデータを公開してきませんでした。



契約では、トレーニングデータセットの閲覧はOpenAIのサンフランシスコオフィスにある、インターネットなどのネットワークにアクセスできない安全なコンピューターで行われることになっています。

また、データを確認する人はまず秘密保持契約書に署名し、身分証を提示した上で、訪問者名簿に記名することになっています。

閲覧中はあらゆるテクノロジーの使用が厳しく制限されており、PCや携帯電話、カメラなどの記録機器は持ち込み禁止となっています。OpenAIはメモを取るために限定的にコンピューターを使うことを認めていますが、メモは原告側の弁護士がその日の終わりに、会社が指定した代表者の立ち会いの下で別の機器にコピーされることになります。なお、トレーニングデータそのもののコピーは、いかなる部分も許可されていないとのこと。

申請書には「検査当事者の弁護士および専門家は、提供されたメモ作成用コンピューターで手書きのメモまたは電子メモを取ることができますが、トレーニングデータ自体をメモにコピーすることはできません」と書かれています。