スパムの無いインターネットを目指して フィルタリング情報「スパムちゃんぷるーDNSBL」を無料公開へ
インターネットは、高速なブロードバンド環境の普及に伴い“生活”に“仕事”にと、すっかり身近なものとなってきた。
今や、パソコン詳しくない学生・主婦からシルバー世代にいたるまでブログや掲示板での更新や書き込みは日記を書くより手軽な感覚で楽しまれる時代となった。
こうした楽しいインターネット利用で困るのが、アダルトサイトや海外の通販サイトへの誘導をねらった“スパム”と呼ばれる書き込みだ。
スパム書き込みは、児童をアダルトサイトへ誘導したり、希望しない通販サイトへの誘導だけでなく、個人情報の盗難や詐欺目的のサイト誘導もあり、被害も増加している。こうしたスパムに対する対策は、サービス運営側がおこなってきたが、排除には人員が必要だったり効果的な防止方法が無く完全には排除できなかった。
今回、ライブドアは社内で研究・活用していたスパム書き込みのフィルタリング「スパムちゃんぷるーDNSBL」を公開した。
「スパムちゃんぷるーDNSBL」は、自社開発のフィルタリングツール「スパムちゃんぷるー」の中から、送信元IPに関する情報のみを取り出し、外部からでも利用できようにしたものだ。
■「スパムちゃんぷるーDNSBL」は、みんなのブログからスパムを減らせる
「スパムちゃんぷるーDNSBL」は「livedoor Blog」や「livedoor Wiki」「livedoor 掲示板」などのコメントやトラックバックのスパム書き込みをフィルタリングした情報の中から、送信元IP(送信者)情報のみを外部からも無料で利用できるようにしたサービスだ。
今回公開のサービスは、主にブログサービス運営者やMovable Type利用者を対象に提供されているわけだが、「スパムちゃんぷるーDNSBL」を導入すると、実際にはどんなメリットあるのだろう?
「スパムちゃんぷるーDNSBL」がBlogサービス側で導入されると、利用者は送信元IP(送信者)情報が分かるので、不正なIP(送信者)を除外することができるのだ。こうして掲示板やブログなどでのスパム書き込みを防止することができるというわけだ。
スパム発信者も当然、新しいIPでスパムを発信するだろうが、「スパムちゃんぷるーDNSBL」の情報も更新されていくので、これまで運営者が個々にバラバラで対応していたケースより効率よくスパム発信者を防いでいくことができるようになる。
また、「スパムちゃんぷるーDNSBL」は無料で公開されるので、多くの運営者が利用できるため、インターネット環境の改善に役立つといえる。
■インターネットの改善へ、「スパムちゃんぷるーDNSBL」公開を聞く
さて、今回、インターネット環境の改善に役立つ「スパムちゃんぷるーDNSBL」の無償公開に踏み切った理由などを担当者 ライブドア 井原氏に聞いてみた。
●開発のキッカケは大量のスパム
編集部:「スパムちゃんぷるー」開発のキッカケと「スパムちゃんぷるーDNSBL」の一般公開を決めた経緯を教えていただけますか?
井原氏:以前、大量のスパムでサーバに負荷がかかり、深夜の対応に追われていたときに、つい「カッ」となって作りました。
Perlのカンファレンス「YAPC::Asia 2008」 で発表したところ意外に大きな反響があり、どの業者も同じようにスパマーとの孤独な闘いをしているのだと感じて連携する必要性を感じました。
●メリットは、ライブドアでの膨大な収集データ
編集部:どういった点が一番のメリットだとお考えですか?
井原氏:「livedoor Blog」や「したらば掲示板」といった国内屈指の規模のスパム受信者が収集したデータが利用できることだと考えています。
編集部:開発で一番苦労された点は?
井原氏:「livedoor Blog」をはじめとする大量のトラフィックをさばけるシステムにすること、今後遭遇しうる未知のタイプのスパムにも柔軟に対応できる設計を考えることです。
●「スパムちゃんぷるー」という名称の由来は?
編集部:ところで、「スパムちゃんぷるー」という名称の由来は?
井原氏:多数の異なるアルゴリズムをもつプラグインを組み合わせたスパムフィルタであることから、「混ぜる」→「チャンプルー」という名称になりました。
●「スパムちゃんぷるー」の手応えと実績
編集部:どういうユーザー、用途に利用していただきたとお考えですか?
井原氏:掲示板やブログなど、スパム書き込みの対象となりうるサービスを運営している個人や法人です。
編集部:「スパムちゃんぷるー」の可能性をどのようにお考えですか?
井原氏:こういった形で情報を公開すること自体に意義があると考えています。情報公開にはノウハウを「ライバル」にも明かしてしまうデメリットや法的な面倒臭さがつきものですが、各社の担当者が世界中のスパマー相手に日夜孤独な闘いを続けるよりも、こちら側で手を組んだ方が良い結果が出せるのではないかと思っています。
「スパムちゃんぷるー」自体は書き込みの内容など、他の様々な情報を判定に利用してデータを蓄積しています。今回公開した「スパムちゃんぷるーDNSBL」はそのうちIPの情報のみしか利用できません。本来は全ての情報を公開したいところですが、プライバシーの問題やサーバの負荷のことを考えると実現には時間がかかりそうだったので、まずできる範囲での公開となりました。
それでも常時数千件のIPアドレスをリアルタイムに管理しているので、状況によっては十分力になれるだろうと考えています。
編集部:社内開発での反響は?
井原氏:ライブドアブログのコメント受け付けサーバが半分以下で済むようになり、スパム書き込み被害も減りました。以前は倍の数でもスパムの嵐でいっぱいいっぱいになることがあったほどです。
ライブドアブログでは、コメントやTBでのスパム件数が相当少なくなったと思います。
●今後の「スパムちゃんぷるー」が目指す夢
編集部:プラグインなどの今後の発展・強化の予定はありますか?
井原氏:「スパムちゃぷるー」をオープンソース化することやIP以外のデータを問題のない範囲で提供するうまい方法がないかなどを考え中です。
編集部:最後に利用者へのメッセージを
井原氏:Nice site ! thank you !!
・「スパムちゃんぷるーDNSBL」
・「おいしいスパムちゃんぷるーの作り方」
・livedoor ラボ 「EDGE」
・スパム書き込み防止に!「スパムちゃんぷるーDNSBL」公開
今や、パソコン詳しくない学生・主婦からシルバー世代にいたるまでブログや掲示板での更新や書き込みは日記を書くより手軽な感覚で楽しまれる時代となった。
こうした楽しいインターネット利用で困るのが、アダルトサイトや海外の通販サイトへの誘導をねらった“スパム”と呼ばれる書き込みだ。
今回、ライブドアは社内で研究・活用していたスパム書き込みのフィルタリング「スパムちゃんぷるーDNSBL」を公開した。
「スパムちゃんぷるーDNSBL」は、自社開発のフィルタリングツール「スパムちゃんぷるー」の中から、送信元IPに関する情報のみを取り出し、外部からでも利用できようにしたものだ。
■「スパムちゃんぷるーDNSBL」は、みんなのブログからスパムを減らせる
「スパムちゃんぷるーDNSBL」は「livedoor Blog」や「livedoor Wiki」「livedoor 掲示板」などのコメントやトラックバックのスパム書き込みをフィルタリングした情報の中から、送信元IP(送信者)情報のみを外部からも無料で利用できるようにしたサービスだ。
今回公開のサービスは、主にブログサービス運営者やMovable Type利用者を対象に提供されているわけだが、「スパムちゃんぷるーDNSBL」を導入すると、実際にはどんなメリットあるのだろう?
「スパムちゃんぷるーDNSBL」がBlogサービス側で導入されると、利用者は送信元IP(送信者)情報が分かるので、不正なIP(送信者)を除外することができるのだ。こうして掲示板やブログなどでのスパム書き込みを防止することができるというわけだ。
スパム発信者も当然、新しいIPでスパムを発信するだろうが、「スパムちゃんぷるーDNSBL」の情報も更新されていくので、これまで運営者が個々にバラバラで対応していたケースより効率よくスパム発信者を防いでいくことができるようになる。
また、「スパムちゃんぷるーDNSBL」は無料で公開されるので、多くの運営者が利用できるため、インターネット環境の改善に役立つといえる。
■インターネットの改善へ、「スパムちゃんぷるーDNSBL」公開を聞く
さて、今回、インターネット環境の改善に役立つ「スパムちゃんぷるーDNSBL」の無償公開に踏み切った理由などを担当者 ライブドア 井原氏に聞いてみた。
●開発のキッカケは大量のスパム
編集部:「スパムちゃんぷるー」開発のキッカケと「スパムちゃんぷるーDNSBL」の一般公開を決めた経緯を教えていただけますか?
井原氏:以前、大量のスパムでサーバに負荷がかかり、深夜の対応に追われていたときに、つい「カッ」となって作りました。
Perlのカンファレンス「YAPC::Asia 2008」 で発表したところ意外に大きな反響があり、どの業者も同じようにスパマーとの孤独な闘いをしているのだと感じて連携する必要性を感じました。
●メリットは、ライブドアでの膨大な収集データ
編集部:どういった点が一番のメリットだとお考えですか?
井原氏:「livedoor Blog」や「したらば掲示板」といった国内屈指の規模のスパム受信者が収集したデータが利用できることだと考えています。
編集部:開発で一番苦労された点は?
井原氏:「livedoor Blog」をはじめとする大量のトラフィックをさばけるシステムにすること、今後遭遇しうる未知のタイプのスパムにも柔軟に対応できる設計を考えることです。
●「スパムちゃんぷるー」という名称の由来は?
編集部:ところで、「スパムちゃんぷるー」という名称の由来は?
井原氏:多数の異なるアルゴリズムをもつプラグインを組み合わせたスパムフィルタであることから、「混ぜる」→「チャンプルー」という名称になりました。
●「スパムちゃんぷるー」の手応えと実績
編集部:どういうユーザー、用途に利用していただきたとお考えですか?
井原氏:掲示板やブログなど、スパム書き込みの対象となりうるサービスを運営している個人や法人です。
編集部:「スパムちゃんぷるー」の可能性をどのようにお考えですか?
井原氏:こういった形で情報を公開すること自体に意義があると考えています。情報公開にはノウハウを「ライバル」にも明かしてしまうデメリットや法的な面倒臭さがつきものですが、各社の担当者が世界中のスパマー相手に日夜孤独な闘いを続けるよりも、こちら側で手を組んだ方が良い結果が出せるのではないかと思っています。
「スパムちゃんぷるー」自体は書き込みの内容など、他の様々な情報を判定に利用してデータを蓄積しています。今回公開した「スパムちゃんぷるーDNSBL」はそのうちIPの情報のみしか利用できません。本来は全ての情報を公開したいところですが、プライバシーの問題やサーバの負荷のことを考えると実現には時間がかかりそうだったので、まずできる範囲での公開となりました。
それでも常時数千件のIPアドレスをリアルタイムに管理しているので、状況によっては十分力になれるだろうと考えています。
編集部:社内開発での反響は?
井原氏:ライブドアブログのコメント受け付けサーバが半分以下で済むようになり、スパム書き込み被害も減りました。以前は倍の数でもスパムの嵐でいっぱいいっぱいになることがあったほどです。
ライブドアブログでは、コメントやTBでのスパム件数が相当少なくなったと思います。
●今後の「スパムちゃんぷるー」が目指す夢
編集部:プラグインなどの今後の発展・強化の予定はありますか?
井原氏:「スパムちゃぷるー」をオープンソース化することやIP以外のデータを問題のない範囲で提供するうまい方法がないかなどを考え中です。
編集部:最後に利用者へのメッセージを
井原氏:Nice site ! thank you !!
・「スパムちゃんぷるーDNSBL」
・「おいしいスパムちゃんぷるーの作り方」
・livedoor ラボ 「EDGE」
・スパム書き込み防止に!「スパムちゃんぷるーDNSBL」公開