[MT plugin]TCode for MT的应用,分析和注意事项

| 21 Comments | 9 TrackBacks | WebBlog Articles

TCode for MT 是 CCode and TCode for MT的关于 防范 TrackBack SPAM 的组成部分。
随着最近网络上的 TrackBack SPAM 大规模卷土重来,装这个 MT plugin 的同好者越来越多,偶也 TrackBack SPAM 受害者之一,也装了这个plugin,在安装和使用中有些体会,写下来于各位同享之。

1。工作原理分析:
开始一直以为这个插件(plugin)的原理是加长TrackBack ID 的长度,让Spam 机器人没有难以猜测其ID来达到Anti SPAM 的目的。
看了原文件后发现是个片面的认识,其防范办法是两个方面的,一的确是增加ID的干扰码,也就是加长TrackBack ID 的长度,但是这个干扰码不是所谓的随机产生的,而是根据其Blog的发表日期换算出来的唯一数。
二是重写MT关于TrackBack的几个默认标签。让TrackBackLink分成了两部分,其中一部分是文本输出,而剩余的部分是由JS输出,这样的好处也是其高明的地方就是阻止SPAM机器人通过抓取网页来分析TrackBackLink,举个例子来说,比如我的一篇 Blog 的 TrackBackLink在安装Tcode以前的是:

http://easun.org/cgi-bin/mt/tb4es.cgi/235

而安装Tcode后该Blog的 TrackBackLink 就变成了
http://easun.org/cgi-bin/mt/tb4es.cgi/235.1464512337

但是在显示这个TrackBackLink的时候,
http://easun.org/cgi-bin/mt/tb4es.cgi/235.
部分是直接显示的,而1464512337部分是由JS
<script type="text/javascript">
obfuscator('ENzNSEveeK', 'wp2qBbOx6yWovMLmr1zRCiVJgXsEnFc0jPA4u5Hdh378TN9SDQteKfaUGYlZIk', '__MTTBLINK__', '', '');
</script>

来完成输出的,这样的情况下,如果是正常的Track,是通过浏览器获取这个地址的,几乎所有的浏览器都支持JS,所以,得到正确的TrackBackLink:
http://easun.org/cgi-bin/mt/tb4es.cgi/235.1464512337
,
而抓网页的SPAM机器人一般都是不解释js的,所以它只能获取部分(不真实的)TrackBackLink :
http://easun.org/cgi-bin/mt/tb4es.cgi/235

而这个地址刚好是MT默认的TrackBack地址,so也骗过了SPAM 机器人的自我检验模块:)

PS:其实,CCcode部分也是利用JS完成类似功能的。只是我们再介绍Tcode而已。

2。TCode的小问题和使用注意事项:
通过代码可以知道,作者阿郎对SPAM的认识很到位,但是可能是为以后功能升级准备吧,留下了一些比较容易被SPAM机器人攻破的不足。
最大的问题就是magicKey问题,阿郎给Tcode设定可一个所谓的“魔法数值”,默认情况下这个数值是

your ping is to be moderated, so please dont't send repeatedly
,这个数值的设定可以1.让用户选择不生成干扰码,而用原始的TrackBackLink加上小数点加上这个key来ping加上Tcode的Blog。2在rdf:ping中显示不同于加干扰码的Ping地址。
所以说,不管是否有无干扰码,magicKey总是优先,也就是,你安装了Tcode,而没有改掉magicKey的话,我直接可以可以通过
http://youwebsite/cgi-bin/mt/mt-tb.cgi/[YouID].your ping is to be moderated, so please dont't send repeatedly
来直接给你TrackBack,而根本不用关心你加了TCode后的新的TrackBackLink是什么!
所以。。这个很容易被高级点的SPAM 机器人利用。解决办法也很简单,修改 Tcode.pl中 $magicKey的数值为你定义的一个复杂的字符串。

另外,干扰码的生成是固定的,通过Blog的发布日期换算出来的,所以。。通过SPAM机器来换算出来这个数字也不是什么难事。只是本plugin的通过JS伪装成原始MT TrackBakLink 的功能骗过了 Spam 机器人的进一部分析。

总的来说,这个plugin是我们对付 TrackBak SPAM 的利器。推荐大家使用。

CCode&TCode 的安装可以参考官方或者这里

引用通告|TrackBacks (9)

本日志的TrackBack URL: http://easun.org/cgi-bin/mtos/tb_mt_41.pl/91.

以下罗列的是网络上引用了本日志 [[MT plugin]TCode for MT的应用,分析和注意事项] 的 Blog 连接。

同SPAM的斗争是一个长期性的问题,需要坚持和耐力。特别是Blog所特有的引用功能,更是SPAM们的操兵习武之胜地,稍微不注意就会塞满你的Blog的角角落落。 MT本身就有一个IP封禁的功能,如果能够坚持将给你发SPAM留言和SPAM引用的IP地址都输入到IP封禁的List里的话,你的网站应该会变得很安静的。但是那么多的禁止IP地址一个一个的输入会很麻烦,这里我介绍一个自动将你的垃圾留言和垃圾引用通告里的IP地址添加到你的IP封禁List里的插件AutoIPBan。 安装非常简单,将AutoIPBa... [阅读更多...]

老办法改脚本文件名还是要用: 在mt-config.cgi中加上: TrackbackScript tb.cgi CommentScript comments.cgi 注意:MT官方网站上的TrackbackScript说明有误:应该是小写b TrackbackScript != TrackBackScript CTCode已经调通了,写笔记宣传一下。感谢毕勤的提示,找到了CCode和TCode这个防spam插件。原理很简单:就是将原来的Comment和Trackback的ID后面增加了一个数字(我... [阅读更多...]

  我怀疑因为昨天引用了平生一笑的文章,暴露了我博客。昨天晚上开始本站就正式和平... [阅读更多...]

安装AutoIPBan插件之后,虽然一直在不断的朝IP封禁List里添加引用SPAM地址,但是每天还是有上百个引用SPAM过来,不得不佩服SPAM业者们的敬业精神。按照车东的改脚本文件名,自己很早以前也试过,估计不到1个星期就会被SPAM业者们给攻陷。 tb-link-lookup.pl这个Spam对策插件很早就知道了。昨天安装到自己的Blog上试了试,今天打开网站的后台一看,一个Spam留言和引用都没有,看来效果还不错。这个插件的原理是对引用的内容里如果不含有引用对象的文章Link的话,全部拒绝接... [阅读更多...]

和SPAM进行正面冲击的同时,也可以采用躲藏的战术,即不让那些SPAM机器人发现你的引用地址。正确的说应该是让SPAM机器人去很难的识别你的引用地址。 doEntity插件就是依照上面的思路,将你的引用地址改为用实体参考(Entity reference)来书写,以达到难以识别的目的。比如说我的上一篇文章的引用地址是 http://www.ikias.com/mt-tb.cgi/194 但是你看看那篇文章后面的Source,引用地址那里显示的是 &#104;t&#116;p&... [阅读更多...]

» links for 2006-11-22 来自 [网络书签聚合] @ 2006年11月23日 00:22

MT HTTP error: 403 Throttled的原因和解决 ... [阅读更多...]

已经说了3个关于引用SPAM的插件了。希望这次是最后一次说关于SPAM插件的问题。 先说说路杨和车东都详细介绍了的TCode插件,这个插件有一个很不好的地方,就是使用一键发表书签进行投稿的时候,让我没有办法去修改他们的引用地址, 对于使用一键发表的人来说,是很不方便的。... [阅读更多...]

http://easun.org/archives/tcode_4_mt_plu... [阅读更多...]

以前我介绍的asciiTBPingfilter插件是对没有汉字的留言和引用都按Spam来处理。感觉这个插件太「残酷」,不... [阅读更多...]

本文相关评论|Comments (21)

还好,目前为止没发现有这么高级的机器人,不过,还是回去马上改掉。

我用这个插件有段时间了,和使用前相比真是天壤之别. 但还是发现有些垃圾可以闯过来,只是数量很少.估计是出现了高级的机器人:(

赶快改过来.

>>Dear leavic: 不怕高级的,就怕不判断的,连续测试性质的SPAM:)
>>Dear Yang:也许同时使用Ikias介绍的AutoIPBan插件会好点。SPAM猛于虎啊 :P
地址: http://www.ikias.com/2006/11/spam.html

唉,真给你说中了,可是我明明已经修改过tcode.pl了,而且还自己测试了一下新的地址,没想到今晚还是收到了七八条spam,不过只持续了几分钟而已。
高级机器人,不过,有没有可能是插件临时停止工作?

>>Dear leavic:我觉得同时启用AutoIPBan会保险点:) 现在SPAM的花样太多。

又是一篇好文章!

在路杨这里受国几次刺激了

YangKang兄谬赞 :) 我只是随笔写下自己的理解而已 :P
道是你那里的资源,MT教程写的很详细哦 :)

之所以不想用autobanip,是担心这东西杀伤力太强,万一影响别人正常trackback就不好了。
以前在别人的blog(还好是wp的)上,因为我用maxthon2,在评论提交时的数据包和其他浏览器不太一样,结果每次提交后就被一个反垃圾插件封IP,还一直都以为是dreamhost的问题。
那叫一个凄凉啊。。。。
其实,只要不出现过去那样一整天持续的spam攻击,偶尔来上两条spam也还受得了。

早上给这篇文章发了一个引用,不知道成功不成功。

我暂时没有漏网的垃圾tb
所以,先维持现状,在后台隔一天就删除一次大概300条垃圾引用吧。。。。

总觉的很长的地址放在页面上有点难看

早上给这篇文章发了一个引用,不知道成功不成功。
Dear ikias:trackBack收到了,因为偶在深圳出差,所以。。没有后台确认而已:)

Dear leavic: autobanip实际上不会auto,所以。这个名字并不贴切,也许叫 QuickBanIP比较好,所以你的担心不会发生的:)

Dear dimlau: 恩。这个如果不严重的话,无所谓拉 :P

这东西就跟闯进城的小批强盗一般,掠夺一番就马上走人。刚才又是9个TB spam,看来还真是要装上auto ban ip才行。

没有用的,人家就从你http://easun.org/的Blog站点首页开始着手,你连接总是有吧,直接LWP或Socket得到所有连接,从后台看缓存,看你的连接进行筛选,如果你的MT连接变了,这边会根据缓存有个错误输出,会重新更新连接,我没有用过spam插件,不知道spam机器人为什么这么愚蠢.嘿嘿

还要验证,晕晕的。路杨加个验证码吧,这样也能防止机器人自动灌水。

14楼的显然对SPAM和网页抓取存在认识不足,另外估计也没有仔细看这篇Blog。
PS:近来依然经常加班??

确实有点用,不过还在试验中

加班很烦.

我一般自写程序做抓取的工具,你看看我抓的你的MT的文章吧~ 很简陋,还不如你说的spam.

兄弟,有段时间没有更新了.我自己也是.不知道是忙还是和我一样不知怎么写了.希望有你的消息.祝你顺利!

Dear Yang:
近来先是出差,又是年底,琐事比较多,所以啊。。有段时间没有更新了:)
打算本周周末恢复吧。呵呵。

Dear cnangel:
抓Web页面很简单,关键是分析。你试试从中分析我的Tb地址吧。
另外,SPAM系统最重要的是低资源占用和效率和通用性,这个就决定了他不会对某个特定的Hack版本来具体分析优化算法。
PS:对于你的采集系统,我的意见,相信你看见了吧。别用我的ID发布...

发表该文评论|Leave a comment

最近发表|Recent Entries

[MT Tips]如何让某个日志在Blog首页固顶?

貌似最简单的办法就是修改日期到一个很遥远的日期,比如 AnySQL 那样:) 但是带来的问题的很多,比如导致Feed阅读器犯糊涂或者影响搜索引擎的收录等等,更糟糕的是对于 日志来说,最主要的就是发布日期。也许大家都已经发现了,我的主页模仿 MT Forum 搞了一个固顶日志(也是为了风格统一)出来,这个固顶日志是后台通过自己设置实现的。是怎么设置的。答案是利用 <mt:Entries> 的tags 功能。 具体概念代码如下:<mt:Entries tag="@top" sort_by="authored_on" sort_order="descend" limit="1" blog_ids="1,5"> dosthing.....</mt:Entries> 这样我们只要要在固定的主题 加上…

北京 Perl Workshop 2008 网站开张 - 接受大会注册,演讲报名

网站开张了, 地址是 http://conference.perlchina.org/bjpw2008/ 由 PerlChina 和 Postgresql China 合办,2008 年 11 月 8 号举行的 Beijing Perl Workshop 是一个免费的 Perl 交流会,向所有对…

好玩的 MT Forum 的按作者归档

Perl Forum 用 MT4 的 MT Forum 的功能搭建起来了好几天了,一直没有发现什么意外,今天突然发现 按作者按月归档 貌似找完了整个发布完的 Perl Forum 也没有找到 link ,查看作者个人信息貌似也没有 link ? 真是好玩的 归档方式。从后台看,给每个用户(作者)都建立了按月的归档页面,估计是为了便于各用户归档自己的文章吧? 后台抓图如下:…