by Andy Wright

「Facebookの元契約社員」を名乗る人物が、Facebook(英語版)で提供されている「トレンド」機能の話題のピックアップから、保守寄りのニュースが排除されていることを暴露しましたが、これに対してFacebookが「人力ではなくアルゴリズムで生成している」と、実際に「トレンド」のチェックに用いているサイトのリストを公開しました。

Information About Trending Topics | Facebook Newsroom

http://newsroom.fb.com/news/2016/05/information-about-trending-topics/



Facebookのヴァイスプレジデントであるジャスティン・オソフスキー氏によると、トレンド機能は、人々が興味を持っている話題を通じて交流できるようにと、個人のニュースフィードとは別に2014年に追加されたもの。トレンドに何が入ってくるのかは人力ではなく、Facebook独自のアルゴリズムに従っています。先の暴露では「保守寄りのニュースが排除されている」とのことでしたが、オソフスキー氏は、サービス利用者に対して価値のある経験を提供することが目的であり、任意の政治的要素が含まれることを理由に排除することは認めていない、と説明しています。

この「トレンドに入ってくる話題」については、できるだけ素早く最新の話題に触れられるように、外部サイトのRSSを利用しているとのこと。そのリストが下記PDFファイルです。

rss-urls.pdf

(PDFファイル)https://fbnewsroomus.files.wordpress.com/2016/05/rss-urls.pdf

リストは「国名」「カテゴリ」「RSSのURL」がセットになっています。上の方はアメリカのサイトが並び、続いてカナダ、インド、イギリス、オーストラリアの順で並んでいます。カテゴリは「一般」「政治」「経済」「健康」「科学」「スポーツ」「技術(IT)」「エンターテインメント」「ゲーム」の9つ。



The Guardianが提供を受けたという資料では、英語版以外での展開も見据えてか、英語圏以外のサイトのデータとしてブラジル、スペイン、ポルトガル、メキシコ、その他ラテンアメリカのものが含まれています。



話題自体はこのRSSリストに含まれているサイトから取り上げられるわけですが、「どれを取り上げるのか」という判断が必要になります。オソフスキー氏は「人力ではなくアルゴリズムを使っている」と説明しましたが、どういうアルゴリズムなのかというと「複数のサイトで取り上げられる話題は、きっと重要な話題なのだろう」というもの。そこで、下記リストに含まれる1000以上のサイトのうち、少なくとも3つ以上のサイトで取り上げられていることを確認するとのこと。

media1k-domains.pdf

(PDFファイル)https://fbnewsroomus.files.wordpress.com/2016/05/media1k-domains.pdf

リストはドメインが数字・アルファベットの昇順で並んでいます。上の方は、あまり日本では有名ではないサイトが並びますが……



IT系ニュースサイトのArs Technica朝日新聞デジタル(asahi.com)ASCII.jpなどが入っています。これより後方にはGIGAZINEも含まれていました。



ニュースサイトではありませんが、画像共有サイトのImgurなども。



こうして話題がピックアップされるわけですが、個人によって好みの話題には差があるので、ここからさらに各個人向けに最適化が行われます。

ちなみに、Facebook側で特定の話題を除去するようなことはしていないものの、アルゴリズムで処理している都合上、玩具の「LEGO」と、映画「LEGOムービー」が同じ話題としてまとめられてしまうようなことがあるため、新たなトピックIDを作ったり、IDを入れ替えたりすることはあるとのこと。

なお、Facebookは今回の「特定の話題が除去されている」という訴えを深刻に受け止めており、現時点ではトレンドが操作された証拠は見つかっていないものの、さらに社内調査を継続することを表明しています。