中国の「金盾」を追跡する「GFWeb」が公開されChatGPTなどのAIサイトをいつから検閲していたのかが判明

2024年9月25日 7時0分

中国政府は国内のインターネット通信を監視するため、グレートファイアウォール(金盾)という国家規模の検閲システムを運用しています。そんなグレートファイアウォールがブロックするドメインを追跡するシステム「GFWeb」が公開され、中国がいつからChatGPTなどのAIサイトをブロックしていたのかといった情報が明らかになりました。

GFWeb Dashboard

https://gfweb.ca/

GFWeb: Measuring the Great Firewall's Web Censorship at Scale | USENIX

https://www.usenix.org/conference/usenixsecurity24/presentation/hoang

A new tool tracks when the Chinese government blocks websites like ChatGPT - Rest of World

https://restofworld.org/2024/when-china-blocked-ai-sites/

グレートファイアウォールはフィルタリング機能を継続的に調整しており、どのようなウェブサイトをブロックしたのかを分析することが、中国政府の方針や態度を理解することにつながります。しかし、中国当局が特定のドメインをブロックした時期を正確に知るには、個々の研究者が特定のドメインについて継続的にテストするしかなかったため困難でした。

そこで、オンラインの検閲や監視についての研究プロジェクトを支援する非営利団体・Open Technology Fundの資金提供により、毎月数億ものドメインを追跡して、グレートファイアウォールにブロックされたかどうかを測定するプラットフォーム「GFWeb」が構築されました。

GFWebの構築にはブリティッシュコロンビア大学やシカゴ大学、トロント大学に拠点を置くCitizen Lab、カーネギーメロン大学、SRIインターナショナル、ストーニーブルック大学などの研究者が協力しています。すでにGFWebは無料で一般公開されており、プラットフォームがまとめたいくつかの情報をチェックできるほか、Googleドライブから生データを取得することもできます。

GFWebによると、記事作成時点でグレートファイアウォールがブロックしているドメインはHTTPベースで96万5233件とのこと。直近でブロックされたドメインとしては、音楽配信サービス・Deezerのドメイン「deezer.com」が2024年8月3日から、分散型SNS・Blueskyのドメイン「bsky.app」が2024年6月15日からブロックされていると報告されています。

また、過去3カ月以内に検閲されたドメインをカテゴリーごとに分類すると、トップが「adalt content(アダルトコンテンツ)」、次点が「file sharing/storage(ファイル共有／ストレージ)」となっています。また、「business(ビジネス)」「gambling(ギャンブル)」「news/media(ニュース／メディア)」「entertainment(エンターテインメント)」などのカテゴリーもブロックされています。

海外メディアのRest of Worldに対し、GFWebの開発者の1人であるブリティッシュコロンビア大学のNguyen Phong Hoang氏は、「GFWebは検閲イベントのタイミングと範囲を追跡する能力を高めるだけでなく、グレートファイアウォールが採用した戦略のパターンとシフトを識別するのに役立ちます。GFWebが研究者、政策立案者、そして一般の人々に対し、中国の検閲の進化する状況についてより深い洞察力を与えることを願っています」とコメントしました。

実際にRest of WorldがGFWebを使用して調査したところ、中国当局がChatGPTのドメインを2023年3月2日にブロックしたことや、機械学習プラットフォームのHugging Faceも同年5月7日にブロックされていたことがわかりました。Hugging Faceは2023年10月に、中国でドメインがブロックされている問題について報告しましたが、これまでブロックの正確な時期はわかっていなかったとのこと。

また、中国当局はコンテンツを生成するAIツールに対する検閲を積極的に行っていることも、GFWebの調査から明らかになりました。以下の図は、中国当局がブロックしたAI関連ウェブサイトを示したもので、横軸は2022年12月～2024年6月までの期間を示しています。オレンジ色がAIツール、濃い青色がChatGPT、薄い青色がChatGPTの代替になるAIツール、薄い紫色がChatGPTのミラーサイト、緑色がHugging Face、ピンク色が宗教的なAIツールです。

Rest of Worldの分析では、中国によるAI関連ウェブサイトのブロックは、新たなAI規制の可決といった重要なイベントとの相関関係がみられました。たとえば2024年春には「Biblechat.ai」「Church.ai」といった数百もの宗教関連のAIウェブサイトがブロックされましたが、これはスピリチュアルなAIアプリケーションが急増した時期と一致しています。

ジョージ・ワシントン大学の政治学助教を務めるジェフリー・ディン氏は、「これは中国共産党が、政府が管理していないコンテンツ生成プラットフォームに非常に敏感なことを示しています。これは中国共産党にとって、主な脅威なのです。AIサイトをブロックしても、開発者がVPNを使用してこれらのツールにアクセスすることは防げないかもしれません。しかし、平均的な中国人がAIを使用して、中国共産党の指導者をからかうビデオや中国の腐敗に関する文章など、政治的にセンシティブなコンテンツを生成することは困難になります」と述べました。

また、中国のインターネット検閲を分析し、回避するためのツールを提供する「GreatFire.org」の共同設立者であるチャーリー・スミス氏は、GFWebが研究者にエキサイティングな可能性をもたらすと主張。「検閲の正確な日付を知ることはさまざまな理由で役に立ちます。たとえば、特定のイベントの前後にウェブサイトがブロックされているかどうかを特定できます。また、当局がどのようにウェブサイトをブロックしているのかを示すのにも役立ちます。主に月曜日にブロックしているのでしょうか？それとも週末にブロックしているのでしょうか？当局がパターンに従ってウェブサイトをブロックしているのかどうかを、これにより特定することができます」とコメントしました。