Archive for 2007-02-26

金漆招牌被打破了

2007-02-26

自從換走了 Rice University 的 Trackback Validator,用 Simple Trackback Validation Plugin 取而代之之後,終於有 trackback spam 逃過我的法眼。comment spam, pingback 和 trackback 三者就算 trackback 最難對付。

在 database 裏看過一下那無數的 spam,內容都是那麼老套,但一時興緻起來,數一下每個 spam 的 user-agent,有點出乎意料之外。將比較像一般瀏覽器的 user-agent 都過濾掉之後,剩下的統計如下:

count agent
2 Blog Checker V2.3
3 Screw-Ball/1.0 (CP/M; 8-bit)
3 Movable Type
6 WordPress/2.0.2
15 Java/1.5.0_06
35 –– WordPress/2.1-alpha3
70 libwww-perl/5.79
137 Mozilla/5.0
249 Net::Trackback/1.01
265
429 TrackBack/1.02
662 Opera/8.0

有些實在沒法估計是亂來還是真的,特別是來自別的 blog 站 (例如 Movable Type) 的 trackback。但也有些 user agent 很明顯地告訴我們一些資料:

  1. Net::Trackbacklibwww-perl 一看就知是用 Perl 寫的。別的 spam 程式要用也寧願用像瀏覽器的 user agent,不會選這個。
  2. Java/* 的不太肯定是否用 Java 寫的程式……
  3. 最可疑的是 TrackBack/1.02。Google codesearch 這次幫上忙了。找一找 “TrackBack/\$”,符合條件的 source code 來自一套 worm (www.thierryb.net/site/IMG/zip/tb_avec_mail.zip)。