関連度の高さが売り 記事を表示すると“それっぽい”関連記事を表示するレコメンドエンジン『soreppo(それっぽ)』を未来検索ブラジルがリリース

写真拡大


未来検索ブラジルは、ユーザーがブラウザで開いている記事ページと内容の関連性が高い、“それっぽい”記事ページを表示するレコメンドエンジン『soreppo(それっぽ)』をリリースしました。

ニュースサイトで記事を読んでいると、記事本文の後に「おすすめ記事」や「関連記事」が一覧表示されているのをよく見るのではないでしょうか。我々ニュースサイトは、読者がひとつの記事を読んだら同じサイトで別の記事も読んでほしいことから、記事ページにほかのページへ誘導するリンクを複数用意しています。別の記事も読んでもらうなら、その人が興味を持って読んでもらえる記事、参考になる記事をオススメしたい――。そんなときに役立つのが、こうした関連記事を表示するレコメンドエンジンです。


既に導入されているガジェット通信の記事ページで、記事本文の下に「おすすめ関連記事 by それっぽ」というウィジェットが表示されているのが分かると思います。

こちらは、ガジェット通信で公開されている記事の中から、現在表示している記事と内容の関連度が高い記事を抽出して一覧表示しています。上の位置にあるほど関連度が高い記事。星の数は、ガジェット通信でのページビューの高さを表しています。今読んでいる記事と内容が似ていて、よく読まれている記事を読みたい場合は、表示順が上で星の数が多い記事を読めばよいわけです。


注目すべきなのは、表示される関連記事の関連度の高さ。たとえば、秋葉原に移転してきたガジェット通信編集部がアキバグルメを制覇すべく、まずカレーのお店を訪ねていく下記記事。

【アキバグルメ制覇】激戦区でバラエティ豊富! 秋葉原のカレー屋を食べ尽くしてみる(その1)
http://getnews.jp/archives/1431520


こちらについて『soreppo』がオススメする記事を見てみると、カレーに関する記事がピックアップされているのはもちろんのこと、記事の中で紹介されているお店の“ブラウニー”“ベンガル”“カレーの市民アルバ”を紹介する記事がピックアップされています。記事に出てきたお店についてもっと知りたい、という人に最適な記事がオススメされていると言えるでしょう。

これまでに公開された記事の全文を解析し、表示中の記事に出てくるフレーズや固有名詞と関連度の高い記事を抽出してウィジェットに表示する仕組み。開発を担当した未来検索ブラジルの森大二郎氏によると、関連度の高い結果を抽出するには、一般に用いられるようなテキストを意味を持つ最小単位に分割して判別する形態素解析だけでは不十分で、人名や作品名など重要なワードを認識する必要があるとのこと。また、記事は公開された瞬間に全文解析され、関連する記事ページに表示可能になります。

全文解析には、未来検索ブラジルがフルスクラッチで独自に開発したオープンソースの全文検索エンジンライブラリ『Groonga(ぐるんが)』を使用。『2ちゃんねる検索』で運用実績がある全文検索の精度と速さが、『それっぽ』の関連度の高さとパフォーマンスを実現しているのだそうです。

未来検索ブラジルは、『soreppo』を汎用のレコメンドエンジンとして、広く採用を呼び掛けていく方針。自社サイトのレコメンドエンジンに採用したいというサイト運営者向けに、下記ページで問い合わせを受け付けています。

レコメンドエンジン「soreppo(それっぽ)」について
http://getnews.jp/soreppo