如何防止网站被采集

如何防止网站被采集,第1张

三种实用的方法。

1、文章头尾加随机广告..

2、文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''

3、正文头尾或列表头尾添加<!--重复特征代码-->

第一种防采集方法:

下面我详细说一下这三种方法的实际应用:

如果全加上,绝对可以有效的防采集,单独加一种就可以让采集者头疼。。

完全可以对付通用的CMS采集程序。。

在采集时,通常都是指定头尾特征从哪到哪过滤.这里我们先讲第一种方法,文章头尾加随机广告..

随机广告是不固定的。

比如你的文章内容是"欢迎访问阿里西西",那么随机广告的加入方法:

<div id="xxx">

随机广告1欢迎访问阿里西西随机广告2

</div>

注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.

第二种防采集方法:

<!--<div id="xxx_文章ID">-->

其它标题或内容...

<!--<div id="xxx_文章ID">--><div id="xxx_文章ID">

随机广告1欢迎访问阿里西西随机广告2

<--</div>-->

</div>

<--</div>-->

这是第二种防采集方法。在文章正文页面插入重复特征头尾代码的注释。

当然,这个可以用正则去掉,但足于对付通用的采集系统。。

第三种防采集方法:

第三种加在文章的列表,随便链接样式:

<a href="xxx.html">标题一</a>

<a alt="xxx" href="xxx.html">标题二</a>

<a href='xxx.html'>标题三</a>

<a href=xxx.html>标题四</a>

原理是让采集的人无法抓到列表链接规律,无法批量进行采集.

如果三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..

如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.哈哈.

如果你的文章来自原创,那像可以加上版权声明,别人随意转载时,你可以要求对方删除你有版权的文章.

如何用MYIIS-VIF限制和防采集功能

可以确定的是,这可以让你的站点减少负担。对服务器做一些限制有时候也是必须的,资源的被占用,被滥用,你都无法控制。所以,得有这样的举措来控制。

在WEB上面,MYIIS-VIF可以做到很多限制来防止采集。特别是有些文章站点,除开可以被蜘蛛采集以外(数据通道)。让我们看看,我们可以限制些什么?

点击“限制与防采集”—>”添加”功能:

1. 禁止使用网络蚂蚁:

现在网络蚂蚁用的真的少了。这个产品其实很不错的。当时用的时候还没有迅雷。

2.禁止使用一切下载工具:

好的,这下就用IE或者浏览器下载吧。

3.禁止使用多线程下载同时禁止断点续传:

插件也别想多线下载了,全世界安静了。这保证了你的原始服务器始终是小流量的,让那些大公司的分流服务器为你工作吧。

4.限制火车头采集和全部.net程序采集:

火车头是个很不错的采集工具,很多采集者都喜欢用它,但它毕竟耗费对方服务器资源。还是向上面那样,让全世界清静点吧。

5.防止flash程序被采集,保护swf文件:

有些站点上大多数是以swf为主的。swf被采集,肯定耗费服务器资源。防止被采集,还是有这个需求的。

以上5点,可以被绕过,但需要点时间去折腾,欢迎广大黑帽子来绕,白帽子来讨论。

高级设置:

这个有点意思,您可以根据抓包的结果,将一些特殊的头放到这里来,如果发现cookies里有特殊的东西,或者提交上来的头有特殊的字符就可以屏蔽。我们以前用这个办法成功屏蔽了一种特殊的CC攻击,估计大部分防火墙(包括CDN防火墙)还不知道吧。聪明的你,如果可以经常抓包,你肯定会有所发现的。来吧,加入MYIIS-VIF的世界,少年。

下面,那个框框的勾选更厉害了。如果有违反这个规则的,将直接一次性锁定ip地址。如果启动ip锁定,在驱动拦截里。还记得我们之前的教程里有提到的。VIF很简单,你一看就会。

防止采集第一种方法:在文章的头尾加上随机不固定的内容。网站采集者在采集时,通常都是指定一个开始位置和一个结束位置,截取中间的内容。

比如你的文章内容是"有讯软件信息网",则随机内容的加入方法:

<div id="xxx">随机内容1+有讯软件信息网+随机内容2</div>

注:随机内容1和随机内容2每篇文章只要随机显示一个就可以了.

防止采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。

文章列表加随机不同的链接标签,比如<a href="" class="xxx"><a class="xxx" href=''>,当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了.

<!--<div id="xxx_文章ID">-->

其它标题或内容...

<!--<div id="xxx_文章ID">--><div id="xxx_文章ID">

随机内容1欢迎有讯软件信息网随机内容2

<--</div>--></div><--</div>-->

即:正文头尾或列表头尾添加<!--重复特征代码-->

防采集第三种方法:加在文章列表的随便链接样式。目的是让采集的人无法抓到列表链接规律,无法批量进行采集.


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/122402.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-14
下一篇2023-03-14

发表评论

登录后才能评论

评论列表(0条)

    保存