防采集代码[推荐!]

作者:网络 来源:佚名 更新时间:2009-02-11 20:36:12 点击:
人工复制文章采集是没办法防止的,也有些站长用换行加隐藏字符的方法来防止直接复制,但这类方法也会严重影响搜索引擎的收录。
下面我说说我自己在做站过程中,想过的一些防采集个人经验和心得吧。
总结了一下,有三种实用的方法。
1、文章头尾无唯一特征代码后加自己网站随机广告广告..
2、文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''
3、正文头尾或列表头尾添加和文章头尾一样的重复特征代码<!--重复特征代码-->
如果全加上,绝对可以有效的防采集,单独加一种就可以让采集者头疼。。
完全可以对付通用的cms采集程序。。

这里提到的特征代码是指一般采集程序用来截取采集数据的头尾代码,例如:
<div id="content">
内容<div>内容里也有div标签</div>
</div><script>...</script>
--------------------------------
上面代码段的采集头尾特征代码就是:<div id="content">和</div><script>
,通过程序得到这两个特征代码,就可以截取并采集到内容了。

下面,我们开始说第一种方法:
文章头尾加本站随机广告信息,随机广告是不固定的,可以在自己的后台建立一个关于本站的介绍、推广信息、优秀资源等,广告条数记录越多越好。字数控制在一行内为宜。

比如你的文章内容是"欢迎访问网页设计爱好者",那么随机广告的加入方法:
<div id="xxx">
{随机广告1}欢迎访问网页设计爱好者{随机广告2}
</div>
注:文章正文头尾不要和随机广告有任何的特定的代码!随机广告1和随机广告2每篇文章只要随机显示一个就可以了,也就是有的文章头部显示广告,有的是尾部显示广告.这样一来,想用机器自动采集你网站内容文章的人,就会把你网站的信息一起采集过去(如果是这样,对方采集越多越好,帮你做宣传)
有些人会说,采集系统有过滤功能,是的,正则很强大,但没有人能一一去查看所有的文章把你的广告特征码给翻查出来过滤的。能过滤采集者所知道的一部分我不怀疑。但要想全部过滤,那还不如直接到你网站复制内容了。

第二种防采集方法:

---------------------------------------
<!--<div id="xxx_文章id">-->
其它标题或内容...
<!--<div id="xxx_文章id">--> <div id="xxx_文章id">
随机广告1欢迎访问网页设计爱好者随机广告2
<--</div>-->
</div>
<--</div>-->
-------------------------------------

这是第二种防采集方法。在文章正文页面插入重复特征头尾代码的注释。
当然,这个可以用正则去掉,但足于对付通用的采集系统。。

第三种防采集方法:

第三种加在文章的列表,随机链接样式或代码:
<a href="xxx.html">标题一</a><a href='#'>2009-10-9</a>
<a title="xxx" href="xxx.html">标题二</a><a href=#>2009-10-9</a>
<a href='xxx.html'>标题三</a><a title="xxx" href="#">2009-10-9</a>
<a href=xxx.html>标题四</a><a href='#'>2009-10-9</a>

-----------------------------------
原理是让采集的人无法抓到列表链接规律,无法批量进行采集.

如果三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..

如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.哈哈.

如果你的文章来自原创,那像可以加上版权声明,别人随意转载时,你可以要求对方删除你有版权的文章.

上面三点只是我个人观点,在这基础上,相信你或大家会有更好的点子来干扰采集者的

作者:网页设计爱好者
来源: