「パルス」「紅白」などなど、テレビ番組の放送に連携してTwitterのツイート数など急上昇することが話題に上がることは多い。
もともとTwitterはテレビと相性がいいと言われている。いまやテレビを見ながらの「ながらツイート」は、多くの人にとって、しっかり日常になっている。

ところで、よくニュース記事などにもツイート数が出てくるが、こうした連動ツイートの調査はどうやって行っているのだろうか?
答えは、(意外性もなく)その手の調査会社を使って調べているということになる。

しかし、このツイート調査は、一般の私たちがウェブやアプリでTwitterを検索するのとは違うのだろうか?

◎Twitterのツイートデータは誰でもアクセスできる!?
実は、Twitterのツイートデータは(公開されているものなら)取得しようと思えば誰でも取得できる。
鍵付きアイコンのツイートやダイレクトメッセージ以外であれば、ウェブでもアプリでも表示できるので、当たり前といえば当たり前なのだが。

その方法として、提供されているのが「Twitter REST API」と「Streaming API」で、Twitter関連サービスはたいていこれらを使って、「こういう条件のツイートが欲しい」とクエリーを送り、返ってきた結果を表示するというしくみ。

それぞれに制限があり、Twitter REST APIでは一回のクエリーで取得できる上限が決まっていたり、特定の期間でのクエリー回数が決まっていたりする。
たとえば、
1分間につき20ツイートしか取得できないとか
1時間につき150回まで実行可能とか(この制限の数字もよく更新されるので、最新ではないだろう)
と、リアルタイムにTwitterの状態を把握するにはちょっと厳しい。

一方、Streaming APIは、ツイートを可能な限りもれなく取得できる仕組みで、基本的にTwitter社との契約が必要となる。
さらに、いまでは過去にさかのぼってすべてのTwitterデータにアクセスでき、大量のデータから見やすい形で抽出できるサービスもある(Twitter社傘下のGnip社によるサービス)。

大掛かりな分析を行う企業はこうしたサービスからデータを引っ張ってきて、ユーザーに提供しているということになる。

ビッグデータとしてのツイート
もちろん、ツイートデータにアクセスできるのとツイートの文章や画像を何かに再利用することとは違う。
ただ、データとして何らかを示す一要素にはなる。

たとえば、先日、台東区・墨田区などで地デジの受信にトラブルがあった。
筆者も対象範囲で、「地デジ、落ちた」などとツイートしたのだが、当日の地デジトラブルの影響を測るために、日付や地域、そして「地デジ」という文字列が含まれたツイートが検索されたら、筆者のツイートもその検索された中には入ってくるということになる。

テレビの視聴率、選挙や世の中の流行、動向調査など、今後は、Twitterでの個々の私たちのツイートは、よりビッグデータとして活用されていくだろう。
Twitter REST APIが開発者向けに公開されているのは有名な話で、それが初期のTwitterブームを招いた、
そして、いまのStreaming APIやGnipの提供するサービスは、こうしてビックデータとして活用される流れを促進するはず。

それが単純に「いい」「悪い」というわけではない。
だが、個人的には、その際には、一般ユーザー向けにもそうしたビッグデータにアクセス、利用できるような環境も、ぜひ用意してほしいと思う。


大内孝子