2008Nov26
スパム鯛めし DNSBL
「スパムちゃんぷるー DNSBL」の記事に対して sino さんという方からこんなコメントを頂きました。
弊社でも「スパムちゃんぷるー」と同様のサービス「スパム鯛めし」をβリリースしました。
http://wiki.takanashi-it-factory.com/index.php?%A5%B9%A5%D1%A5%E0%C2%E4%A4%E1%A4%B7
ユニークIPベースで92.8%、延べIPでは99.4%の高確率でスパムを検出できています。よろしければお使いください。
ウェブシステム開発などされている個人経営の「高梨 IT 製作所」、その社長さん自ら宣伝されにきたようです。
テスト方法は最近受けとったスパムコメント22件と非スパムコメント/トラックバック22件の合計44件の IP アドレスを「スパムちゃんぷるー」、「niku.2ch.net」、そして「スパム鯛めし」で正引きしました。「127.0.0.2」が返ってきたらスパム、それ以外なら非スパムです。
以下結果です。
DNSBL | スパム検出率 | 誤判定率 |
---|---|---|
スパムちゃんぷるー | 23% (5/22) | 0% (0/22) |
niku.2ch.net | 68% (15/22) | 27% (6/22) |
スパム鯛めし | 73% (16/22) | 18% (4/22) |
結論から言ってしまうと「スパム鯛めし」は「niku.2ch.net」と同程度の精度を持っているようです。
(サンプルセットが少ないため、この結果からだけではどちらが上かを導く事は不可能)
「スパムちゃんぷるー」は検出率が低いものの、誤判定しにくいという特徴があるようです(今回はゼロ)。
非スパムをスパムと誤検知してしまう「スパム鯛めし」と「niku.2ch.net」は、スパムフィルターとして使う場合に充分な注意が必要です。まあ、この辺のさじ加減はなかなか難しいところがあると思いますが、もう少し頑張って欲しいところ。
しかし、今回テストをして「スパム鯛めし」が他2つにまったくひけをとらない性能を持っていることに驚きました。
一応法人格とはいえ個人でここまでやれるのはすごいと思います。
「スパムちゃんぷるー」を開発したライブドアは、たくさんのブログや掲示板等に向けられたスパムから蓄積したデータをもとに DNSBL を構築しています。一方の「スパム鯛めし」を開発した高梨 IT 製作所にはライブドアと同じスケールで IP アドレスを収集する術がないわけで、どのような方法でこれほどのものを構築したのかとても気になります。あいにくスパム判定のロジックは非公開との事で、残念…。
ちゃんぷるーに対抗して鯛めしというすごいネーミングセンスですが、技術は本物でした。
今後の発展にも期待ですね。
関連記事
| 09:45 PM | comments (2) | Tweet
| 話題::ネット関連 |
コメント
nJoy BLOG 管理人様
sino こと (有)高梨IT製作所の高梨です。
#弊社社名が「高橋...」となっておりますので、
#お手すきのときにご修正いただければと思います。
弊社DNSBL「スパム鯛めし」を取り上げ、またご検証いただき、誠にありがとうございます。誤検出が若干多いのが製作者としては気になりますが、今後の改良点とさせていただきます。
もしよろしければ、弊社(info@takanashi-it-factory.com)宛に非スパムIP一覧をお送りいただければ幸甚です。その際には「公開しない」というお約束の元、ロジックをお知らせ致します。
よろしくご検討くださいませ。
それでは失礼致します。
| sino | URL | 2008/11/27 07:56 AM | 39m5/rAE |
社名を間違えてしまい本当にすいませんでした。
早速「高梨 IT 製作所」に修正しておきました。
> 非スパムIP一覧をお送りいただければ幸甚です
開発のお役に立てるのでしたら、喜んで提供させていただきます。
後でメールで送ります。
| CJ | URL | 2008/11/28 09:00 PM | xnOwozF. |