欧米の学術出版社で「AI企業へのライセンス販売」が新たな収益源に…日本が大きく後れをとる理由

写真拡大 (全4枚)

「生成AIの台頭で本が売れなくなり、出版ビジネスが崩壊する」といった意見は根強い。

しかし、AIモデルが高度になるほど、より高品質で特定の領域に特化したトレーニングデータが必要になっている。

そこでAI企業は学術ジャーナルを持つ出版社などに対して「対価を払うから学習させてほしい」とライセンス許諾を求める動きが2023年頃から徐々に活発化してきている。

欧米の出版社、学術ジャーナルは「AIから稼ぐ」ために交渉・契約をしているのだが、日本ではこうした動きはにぶい。いったいなぜなのか?

「出版物のデータ」を競うように求めるAI企業たち

生成AI(LLM)は、ネット上の質の低いデータやAIが作った合成データを学習に使い続けると、出力の質が低下していく。

それに対して、学術機関や出版社が査読や編集プロセスを経て制作した出版物は、ゴールドスタンダード(最高水準のデータ)とみなされている。

AIモデル同士の競争が激化するなか、正確で専門的な知識の有無がAIの性能を左右する要因のひとつとなっている。

こうしたAI企業による学術ジャーナル、出版社へのライセンス許諾を求める動きは、2023年頃から始まり、2024年に多くの出版社が最初の契約を結ぶようになった。

英国出版協会(PublishersAssociation)が2026年3月に発表した報告書"Content Superpower"(すごい名前)によると、AIライセンス市場に関与する出版社の数は2026年末までに倍増すると予測され、今年中に英国内のすべての主要な学術出版社が何らかの形でこの市場に参入すると見込まれている。

アメリカの学術出版大手WileyはAIサービス事業で2025年度に約4000万ドル(約64億円)を売り上げ、2026年度は第3四半期時点ですでにそれを上回るなど、急成長を遂げている。

もっとも、同社の通期売上高は2024年度が約18億7200万ドル、2025年度が約16億7700万ドルだから、4000万〜5000万ドルというのは売上高全体の約2.4%〜3.0%にすぎない。

ただし、過去のアーカイブや既存コンテンツをデータ提供するAIライセンス契約では追加の制作コストなどがそれほどかからず、売上の大部分がそのまま営業利益になると予想される。

同社の営業利益は2024年度で5200万ドル、2025年度で2億2100万ドルだから、営業利益やキャッシュフローベースで見るとインパクトが大きい。

英国の出版社は、自社コンテンツがAIの学習に無断で使用されているかを確認し、ライセンス交渉や法的措置を行うための前提として、AI企業に対して「どのデータを使って学習したのか」という入力データの透明性を法的に義務付けるよう政府に強く求めている。

合わせてTheGuardian、BBC、FinancialTimes、SkyNews、The Telegraphといった英国主要メディアは「Spur」と呼ばれる連合を結成し、オリジナルなジャーナリズムを保護し、AI企業からの適正な支払いとコントロールを確保するライセンス枠組みの構築を訴えている。

ようするにロビイングをし、政治の力も使って「ちゃんとカネを払え」という方向に持っていこうとメディア・出版社側が奮闘している。

学習(トレーニング)からRAG(検索拡張生成)へ

当初はAIの事前学習(トレーニング)目的でデータを買い切りで渡す契約が主流だったが、今ではRAG(Retrieval-AugmentedGeneration)向けのライセンス供与にトレンドが移っている。

RAGとは、ユーザーがAIに質問をすると、AIが事前学習した知識に基づいて答えるのではなく、ネットの最新記事や特定のデータベースから質問に関係する情報を検索(Retrieval)し、拾ってきたものから生成する(Generation)しくみのことだ。

そこで参照されるデータベースとして、出版社が保有する最新の学術論文や報道記事をライセンス契約するかたちにシフトしてきている。

買い切りとは違って、RAGの契約はコンテンツの使用頻度に応じた従量課金になることが多い。つまり、出版社に定期的な収益をもたらす(もちろん、使われなければその限りではないが)。

英国出版協会の調査では、2025年末時点でライセンス契約を結んだほとんどの出版社が「翌年(つまり2026年)のRAGベースの収益が10%以上増加する」と予測していた。実際にはすでにこれをさらに上回る状況だという。

生じる新たな格差と著者の不満

もちろん、万々歳で問題なし、とはいかない。

OpenAIやMicrosoftなどと数千万ドル規模の契約を結べるニュース会社や大手学術出版社は、AIの回答内でも優先的に引用される。

一方、交渉力を持たない小規模出版社はAIの回答に登場しにくくなるという二極化が進行している。

これに対してはAIが情報を探しに来るクローラーがアクセスした際に自動で少額の支払いを求めるしくみなど、小規模な出版社でも収益を得られるしくみづくりが一応模索されている。

また、「事前通知がされていない」「利益還元が不十分だ」といった不満がアカデミアや執筆者から噴出しており、「著者に無断でアクセス権を売るな」と抗議して自分が書いた出版物をオプトアウト(利用拒否)する権利を求める動きもある。

日本が大きく後れをとる理由

ただ日本はそれ以前の状況である。

英国以外にも、欧米諸国では法規制の強化を背景としてAI企業が訴訟リスクを回避するため、大手メディアや出版社とAI企業数百万〜数億ドル規模のが巨額の契約を次々に結んでいる。

一方、対照的に日本の著作権法30条の4では、情報解析やAI学習のためのデータ無断利用を広く認める著作権の例外規定がある。つまり法律上、原則として許諾なしでのAI学習が可能である。それがゆえに、AIライセンス市場の形成が遅れている。

もちろん、著者・出版社の不満の高まりを受けて政府もガイドライン整備に動いてはいるし、出版社各社にGoogle(Gemini)などから専門分野の質問に対知る回答精度向上のために特定の書籍から学習させてほしいとか、あるいは日本語学習のために過去の著作をごっそり学習させてほしいといったオファーが水面下で行われているものの、諸外国と比べれば動きは決して速くない。

実は、英国政府も当初はAIの学習を促進するために、権利者がオプトアウトしないかぎり広くデータマイニングを認める著作権の例外規定を導入しようとしていた。だが、クリエイティブ産業や出版社からの猛反発を受けて立法措置は当面見送ったという経緯がある。

日本政府にもイノベーション創出や技術進歩を著作権法の規定が阻害しないように等々の思惑、ねらいがあって現行の著作権法30条の4の規定にしたわけではあるものの、結果としては海の向こうのAI企業に無償で学習され放題になってしまった。

ライツビジネスが重要だということに異論がある出版業界の経営者は少ないだろうし、自分の本がなんらか使われるなら正当な対価を払ってほしいと思う著者のほうが多いだろう。

日本もAIライセンスビジネスの波に乗れるように、英国同様、やはり業界団体なりが政治の力も使って働きかけをもっと積極的にしていくべきではないだろうか。

【もっと読む】イギリスの若者のあいだでクイズ本と聖書が大流行…「クイズ」と「新しい信仰」の意外な共通点

【もっと読む】イギリスの若者のあいだでクイズ本と聖書が大流行…「クイズ」と「新しい信仰」の意外な共通点