金漆招牌被打破了
2007-02-26自從換走了 Rice University 的 Trackback Validator,用 Simple Trackback Validation Plugin 取而代之之後,終於有 trackback spam 逃過我的法眼。comment spam, pingback 和 trackback 三者就算 trackback 最難對付。
在 database 裏看過一下那無數的 spam,內容都是那麼老套,但一時興緻起來,數一下每個 spam 的 user-agent,有點出乎意料之外。將比較像一般瀏覽器的 user-agent 都過濾掉之後,剩下的統計如下:
| count | agent |
|---|---|
| 2 | Blog Checker V2.3 |
| 3 | Screw-Ball/1.0 (CP/M; 8-bit) |
| 3 | Movable Type |
| 6 | WordPress/2.0.2 |
| 15 | Java/1.5.0_06 |
| 35 | –– WordPress/2.1-alpha3 |
| 70 | libwww-perl/5.79 |
| 137 | Mozilla/5.0 |
| 249 | Net::Trackback/1.01 |
| 265 | |
| 429 | TrackBack/1.02 |
| 662 | Opera/8.0 |
有些實在沒法估計是亂來還是真的,特別是來自別的 blog 站 (例如 Movable Type) 的 trackback。但也有些 user agent 很明顯地告訴我們一些資料:
- Net::Trackback 和 libwww-perl 一看就知是用 Perl 寫的。別的 spam 程式要用也寧願用像瀏覽器的 user agent,不會選這個。
- Java/* 的不太肯定是否用 Java 寫的程式……
- 最可疑的是 TrackBack/1.02。Google codesearch 這次幫上忙了。找一找 “TrackBack/\$”,符合條件的 source code 來自一套 worm (www.thierryb.net/site/IMG/zip/tb_avec_mail.zip)。










