貴重な財産を守らなければ…

大統領選挙から数ヵ月が経った今も、連日のようにニュースを騒がせているトランプ政権です。様々な理由で人々は政府の動きに注目していますが、特に科学者たちが心配しているのはこれまで蓄積してきた研究データ。気候変動、水質問題、食料供給といったトピックに関する科学的な研究データが削除されてしまうのでないかと恐れているわけです。

そのためにアメリカ各地では選挙の直後から、ボランティアたちが集まって政府系機関によって公開されている科学データをコピーして別の安全な場所で公開するという動きが起こっています。中には政府機関の職員たちも、匿名でボランティア参加しており、危機感はかなり大きいようです。米GizmodoのMandelbaum記者はボストンでの集まりを取材してレポートしています。

***

政府に対する不安感がムーブメントに

大統領就任式の数日後、多くの人がパニックになっていました。なぜならホワイトハウスをはじめとする政府機関のウェブサイトが次々と変更されていったからです。特に大きな懸念としてあがったのが、環境問題、水の品質、食料供給、気候変動に関してのデータについて。合計で何ペタバイトにものぼるこのデータのうち、政府にとって不都合な部分が削除/公開停止されてしまうのではないかと危惧している専門家がたくさんいます。

心配をした人々は協力して重要なデータを集め始め、それはすぐに一つの運動へと拡大しました。コンピューター・ギークたち、科学者たち、政府機関で働く人々、そして一般市民たちがこの膨大なデータを協力してダウンロードしていっています。その内容も農業にまつわるもの、司法関係のデータと様々です。運動の目的はこういったデータを、別の安全な場所で誰にでもアクセスし利用できる形で公開しようというものです。

政府から独立した、有益なデータベースの誕生

「もしも運よく、データが取り下げられることがなかったとしても、この運動によってデータを簡単に発見し、利用することができるサービスを作れます。データにアクセスできるようになれば、人々はより建設的かつ客観的な議論を持つことができます」とボストンで先日行われたイベント「データ・レスキュー(DataRescue)」の主催者であり、MITの大学院生であるジェフリー・リゥさんは語りました。

こういった種類のイベントは12月から開始されてきました。最初に動いたのはトロント大学やペンシルバニア大学の科学者、リサーチャー、そして図書館員たちです。気候変動に関して、科学者たちの間で同意されている意見というのはいくつも存在しています。そういった科学者たちの意見に対して懐疑的なトランプ政権が、気候データに対して何らかの処分をしてしまうのではないかと恐れたわけです。

既に政府系ウェブサイトで、文章表現が変えられているトピックも出てきているものの、現時点では大規模な削除は行われていないようです。しかし不安を抱えるボランティアたちによるデータレスキューと呼ばれるイベントが、アメリカ全土で既に20箇所で開催されており、今後も継続して開催される予定です。

「データ削除は現代の焚書」

「データの削除は現代における焚書だと思っています」と語ったのはITコンサルタントのキャロライン・ケリガンさん。彼女はMITにおけるデータレスキュー・ボストンのシーダー(seeder:種を蒔く人)と呼ばれる参加者の一人。

この運動には担当する作業ごとにわかりやすい名前がついています。シーダーの他には「サーベイヤー(Surveyor:調査を行う人)」、「ハーベスター(Harvesters:収穫者)」、「ストーリーテラー(Storytellers)」があります。さすが科学者たちによって運営されているだけあり、ストラクチャーがしっかりしていながらロマンチックなのが良いですね。専門知識や技能があってもなくても参加できるように作業分担が計画されているようです。


170304government-1-1.jpg

image: Ryan F. Mandelbaum


このイベントでは広い部屋で人々がコンピュータに向かって座り、談笑をしながら作業をしています。部屋の壁にはコーヒーやピザの箱が積み上がっていて、週末を通じて作業が進められたのが分かります。役割分担といったストラクチャーは最初からあったわけではなく、イベントが回数を重ねるにつれて形を成してきたそう。

サーベイヤーがハウツー・ガイドを制作し、それを参照して人々がデータをどこから見つけて、何をダウンロードすべきで、どうやってデータセットが被らないようにするか気をつけながら作業をします。シーダーたちがデータを入手するページをオーガナイズし、番号をふっていきます。チームの中でも最もテクノロジーに強いハーベスターたちがスクリプトやコードを使ってそれぞれのサイトからデータを入手していきます。ストーリーテラーたちはソーシャルメディア上でその日のアクティビティを記録。それぞれのデータ・セットがなぜ重要で、何に使われる可能性があるのかを書いていきます。

ボストンでのイベントでは、いくつかのデータセットがコピーされました。気候に関するデータだけではありません。取材をしたサーベイヤーの一人は、取材時に移民と被雇用者の権利についての法務省のデータを扱っている最中でした。データは取り出しただけでなく、確認され、そしてDataRefugeで入手可能になります。

「負の歴史が繰り返されないよう、予防策を」

参加者は色々な理由でこのプロジェクトに関わっているようです。イベントに参加していたハーベスターの一人、ジョージ・ゴーデットさんは「大統領選挙の後、無力感に襲われていました。また何か変化を起こしたいという気持ちはあったもののそれを行動に移す場所がありませんでした」と語ってくれました。また、同じくハーベスターとして参加したジャネット・ライリーさんは、彼女の「オタク・パワー」を何か目的を達成するために使える絶好の機会だと述べています。「このデータのためにお金を(税金を)払ったんだから、誰かが削除なんかしたら許さない」


170304government-2.jpg

image: Ryan F. Mandelbaum


参加者の中にはやはり、データの保管によって将来おこりうる問題に備えることができる、と考えている人が多いようです。アメリカにおける科学的証拠データを保護する国際NGO「EDGI」からのボランティア、ブレンダン・オブライエンさんは「私はカナダ人です。スティーブン・ハーパー首相の時代を経験しました。それは科学的な発見に対する検閲が行われた負の歴史のような時代でした。同じことが起こるとは限りませんが、予防対策をとっておく必要があります。予防対策をとっておけば何かを失ってしまうことは無いと保証されます」と語ります。彼はアーカイブのためのコードの一部を作成したそうです。リゥさんによると、環境保護庁の職員たちからの参加者もいるとのこと。ただし懲罰を受けないよう、匿名を希望しているそうです。

「我々は、政府を丸ごとアーカイブしようとしているんだ」

このプロジェクトの目的はデータを保護するだけではなく、一般に公開することも含まれています。DetaRefugeとEDGIは共にデータの保護と配信に取り組んでおり、データに科学者たちがアクセスできるようにしようとしています。それにデータ収集をより容易にするためのツールも同時に開発しているとのこと。データは全てタグ付けされ、何のデータであるかといったメタデータもまた収集されなければいけません。また、中身に応じて特別なコードを利用することで、データセットの内容が変更されていないこともチェックしているそう。

リゥさんは言います。「私の博士課程の最初の一年間は、政府のウェブサイトから必要なデータを入手するためのツールを開発するのに費やした。(種々のデータが揃っているデータ・アーカイブがあることで)色々な実際のリサーチにとって、時間とエネルギーの節約になると思います」

現時点では、データはアマゾンのストレージ・サーバー上に置かれています。しかし政府の持つデータの量は10テラバイトから50ペタバイトはあると考えられます。運営チームはまた、DatやIPFSといったシステムを使って、ウェブ上の複数のデータ・コピーのシンクロに取り組んでいるそうです。

DataRefugeもEDGIも寄付金は受け付けているものの、基本的にはボランティアによる作業で運営されているとのこと。ペンシルバニア大学付属図書館デジタル・スカラーシップのアシスタント・ディレクターであるローリー・アレンさんもそんなボランティアの一人。大学はこの運動の作業内容を学校の認める「ボランティア」として認定しているようですが、彼女はそのためにやっているわけではないようです。「5時になったから帰宅、というノリではやっていない」と言います。

前述のオブライエンさんは、壮大な全体像を見ているようです。このDataRescueを通じて、多くの人やグループが、これまでにない規模のデータ収集の効率化という壮大なプロジェクトに取り組んでいるわけです。「我々は再現できる方法でもって、政府をまるごとアーカイブしようとしているんだ」


・イーロン・マスク氏がトランプ大統領批判ツイートから速攻削除、その理由とは


image: Deigo Grandi / Shutterstock.com
source: DataRefuge, The Washington Post, Climate Central, PPEH LAB
reference: EDGI, Dat, IPFS

Ryan F. Mandelbaum - Gizmodo US[原文 1, 2, 3]
(塚本 紺)