アメリカの高級日刊新聞紙・The New York Timesが2023年12月に、著作権侵害でOpenAIとMicrosoftを提訴したことを受けて、OpenAIが「The New York Timesの訴えには根拠がない」との反論記事を公表しました。

OpenAI and journalism

https://openai.com/blog/openai-and-journalism

OpenAI claims The New York Times tricked ChatGPT into copying its articles - The Verge

https://www.theverge.com/2024/1/8/24030283/openai-nyt-lawsuit-fair-use-ai-copyright

OpenAI warns copyright crackdown could doom ChatGPT

https://www.telegraph.co.uk/business/2024/01/07/openai-warns-copyright-crackdown-could-doom-chatgpt/

OpenAIは2024年1月8日に公開したブログ記事で、同社とThe New York Timesが2023年12月19日まで記事の利用についての交渉を続けてきたことを明かし、The New York TimesがOpenAIを訴えたことを12月27日の紙面で知ったのは「私たちにとって驚きであり、失望でもありました」と述べました。

The New York Timesの訴えの主な内容は、ChatGPTが記事を盗用したというものです。これに対して、OpenAIは「The New York Timesが意図的にトレーニングデータを反復させて、記事を盗用しているかのように出力させた」と指摘しています。



OpenAIによると、ChatGPTの盗用の証拠として提示されたThe New York Timesの記事は、複数のサイトに転載されている古い記事だとのこと。ChatGPTがそれをトレーニングデータとして使用していたとしても、それをそのまま出力してしまう「オウム返し(regurgitate)」を起こさないようにOpenAIは「Browse」と呼ばれるChatGPTの機能を削除したため、通常の手順では記事の複製が行われないようになっていると、OpenAIは主張しています。

このことから、OpenAIはThe New York Timesの訴えについて「私たちのモデルにオウム返しをさせるために、記事の長い抜粋を含むようにプロンプトを意図的に操作したようです。このようなプロンプトを使用した場合でも、我々のモデルは通常、The New York Timesが指摘したような振る舞いはしません。従って、これは彼らがモデルにオウム返しをするよう指示したか、多くの試行の中からチェリーピッキングした例であることを示唆しています」と述べました。

The New York Timesによる著作権侵害の訴えを否定する一方、OpenAIは著作権で保護されたコンテンツの使用はAIの発展に不可欠なものだとして必要性を強調しています。

OpenAIはイギリスの上院(貴族院)通信デジタル委員会に提出された資料の中で、「今日の著作権は、ブログ投稿、写真、フォーラムへの投稿、ソフトウェアコードの一部、政府文書など、事実上あらゆる種類の表現をカバーしているため、著作権で保護された素材を使用することなく、主要なAIモデルのトレーニングをするすることは不可能です」と述べました。



また、OpenAIはEU、日本、シンガポール、イスラエルなどの国々に著作権で保護されたコンテンツをAIモデルのトレーニングに使用することを認める法律があると指摘し、そのような利用法はフェアユースとして許容されているとの見方を示しました。なお、OpenAIが示した日本の法律とは、著作権法第47条の5に規定されている「電子計算機による情報処理及びその結果の提供に付随する軽微利用等」のことです。

こうした点から、OpenAIは「The New York Timesの訴訟には根拠がないと我々は考えています。それでも、我々はThe New York Timesとの建設的なパートナーシップを望んでおり、AIによる変革の可能性を実現することで質の高いジャーナリズムを生み出す能力を手助けするべく、報道機関と継続的な協力ができることを期待しています」と述べました。