米国議会図書館は、なぜTwitterの全ログを保存するのか

写真拡大

Nate Anderson(Arstechnica)


210年の歴史を誇る米国議会図書館の、現在167TBのウェブデータ・アーカイブが保存されているエアコンが効いたサーバー群に、『Twitter』の全てのツイート(つぶやき)が加えられることになった(対象となるのは、2006年に開設されて以来のTwitterの公開ツイート全てで、私的なツイートは含まれない)。

それは大きなニュースだった。議会図書館が4月14日(米国時間)に公式ブログでこのことを発表すると、同サイトにアクセスが集中しすぎて、「loc.gov」サーバーが丸ごとダウンしてしまったほどだ。

「Twitterが現代の新しいニュース配布メディアであることを、私たち自身が目の当たりにした」と話すのは、議会図書館が実施している『全米デジタル情報基盤整備・保存プログラム(NDIIPP)』の責任者、Martha Anderson氏だ。プレスリリースを書面で出しても、反応はきわめて小さい。しかし議会図書館は、今回の計画についてツイートした結果、即座に圧倒的なフィードバックを得た。

今回の話を持ち込んだのはTwitterのほうだった。Anderson氏ら議会図書館の職員は、いくつかの条件付きでTwitterデータを収蔵することに合意した。その条件とは、検索エンジンへの公開は行なわない、単一ファイルの形では公開せず、許可された研究者にのみセットで提供する、といったものだ。

Anderson氏は今回の取り組みの理由として、個々のツイートというよりは、全体として見ると素晴らしいリソースになるということを挙げる。Twitterは、われわれがコミュニケーションを行なう技術上の変化であり、こうしたことはそれほどしばしば起こらない。コミュニケーションの大きなプラットフォームについては記録したい、とも語る。

もちろん課題はある。たとえば、短縮URLはどう取り扱うべきなのだろうか。数十年後には、現在の短縮URLサービス会社が無くなっていることも考えられるが、その場合、ツイート内のリンク先が、短縮URLからはわからなくなってしまう。URLはTwitterが持つ重要性の大きな部分を占めており、どのようなリンクが人々に共有されているがわかる。

また、140文字以内にツイートを詰め込むために使われる、時に暗号的なスラングも、将来は「解析」が問題になるかもしれない。現在の学者たちが、中世の修道士による手書き文字の研究を行なっているように、未来の専門家たちが、21世紀初頭の「文字会話(TXTSPK)」をあれこれ解釈する姿を想像することができる。

将来の研究者からすると、これは素晴らしいアーカイブになるだろう。エリザベス朝時代の英国を研究していて、当時の日常生活について詳しく知りたくなった場合を考えてみてほしい――何が飲食され、どんな冗談が話され、どう移動していたのかと。個人の日記や書簡などはあるものの、それらは当時のエリートのもので、部分的で内容も制限されている。しかし、当時の人がこんなふうにつぶやいていたらどうだろう。


こうしたつぶやきは、ローカルな情報の宝庫になるだろう。法廷記録や公的な記録しか無いような状態よりははるかに優れている、とAnderson氏は語る。

ツイートへのジオタグが一般的することで、可能性はさらに増大するだろう。Anderson氏は最近、17世紀スペインの密輸ネットワークに関するデジタル地図を作成し、そのネットワークがどう動いていたかを分析している研究者と出会ったという。ツイートでも同様の地図化が行なえるだろう。たとえば「hoagie」[サブマリン・サンドイッチのことで、この他にもさまざまな呼び名がある]という言葉の利用を米国の地図上にプロットしたり、「soda」対「pop」[どちらも炭酸飲料を指す]を時代を超えて追跡したりということが考えられる。政治や社会のトレンドもマッピングできるだろうし、Twitterユーザーの移動もマッピングできるだろう。

{この翻訳は抄訳です}

WIRED NEWS 原文(English)

  • つぶやきは新しい思考の単位か:Twitterの未来2010年3月1日
  • 北米大雪でネットが活躍:Twitter情報をマッピング2010年2月12日
  • デジタル化を進める米国議会図書館2001年1月24日