ソフトウェア開発プラットフォームのGitHubは、AI開発団体のOpenAIと協力してコードの続きを記述するAI「GitHub Copilot」を開発しています。2021年6月21日からはGitHubの全ユーザーがGitHub Copilotを利用可能となりましたが、このGitHub Copilotについて「学習元となったソースコードの著作権を侵害している」とする指摘が相次いでいます。





GitHub CopilotはPythonやJavaScript、TypeScript、Ruby、Goなど数十のプログラミング言語に対応したコード自動補完AIで、ユーザーが記述したコードの続きを予測して自動入力してくれます。GitHub Copilotはバージョン違いのコードやベストプラクティスから離れたコードを記述する場合があるため完全に人間の代替となるものではありませんが、経験を積んだプログラマーにとってはコーディングのサポートに有用であるとして高く評価されています。

しかし、GitHub Copilotの学習にはGitHub上にアップロードされたコードがライセンスの種類に関係なく使用されたことがGitHubのサポート担当者とのやり取りで判明しています。このため、GitHub Copilotを商用利用することは著作権的に問題があるのではないかという議論が生じています。

GitHubのソースコードで学習したプログラミングAI「Copilot」は著作権侵害なのか? - GIGAZINE



GitHub Copilotが全ユーザーに開放された後、新たにソフトウェアエンジニアの@ReinH氏は、コードの再頒布時にクレジット表記を求める「MITライセンス」などのライセンスが付与されたコードがGitHub Copilotの学習に使用されていることや、GitHub Copilotで学習元のコードがそのまま表示されるという例をあげて、GitHub Copilotを「他人が書いたコードを勝手に売るサービス」と非難しています。





加えて、@ReinH氏はGitHubを所有するMicrosoftが多くの弁護士を抱えていることを指摘し、開発者がGitHub Copilotの問題点を訴えることには大きなコストがかかると主張しています。





@ReinH氏の発言には多くの開発者が同意しており、ニュース共有サイトのHacker NewsにはGitHub Copilotの学習から自らのコードを除外するオプションの提供を求める意見が投稿されています。一方で「著作権的に問題があったとしても多くの開発者は利便性の高さから目をつぶるでしょう」という意見も存在しています。