再附加说明下,因为绝大多数群发外链是出现在博客或论坛当中,当有人留言和发文时,通过平台本身程序可以为网友发布的链接加上nofollw标签,这样在这些平台上群发外链,对搜索引擎本身就不会增加其对应的抓取工作量了,因为搜索引擎一发现加了nofollow标签,就不会进行爬行了。
我们来分析下原理,你的一个新站,拥有1000个页面,里面有非常多的客服帮助啊,注册,登录,用户协议等,这些内容所在的页面对搜索引擎而言,是没什么价值的,同时,即使搜索引擎抓取了这些页面,对你网站本身的SEO也帮助不大。
我们假设这些对搜索引擎无价值的页面有300个,但是我们知道的是,一个新站,不可能短期内搜索引擎就进行全部收录,搜索引擎的原理也是先发现你的网站,然后“住”进来,根据你页面的链接进行抓取,而抓取的量假设每天是100个(因为我们知道搜索引擎对新站页面的抓取数量可不太令人满意),建议可以看下之前写的搜索引擎喜欢怎么样的网站。
那么抓取完你1000个页面,搜索引擎用了10天时间,过程当中还有一些筛选,比如一些重复或相似的内容,以及一些类似登录啊注册之类的没什么价值的页面,最终有可能又会把这些已经抓取进来的页面重新从数据库里删除掉。
现在的问题已经很明显了,如果你合理的利用nofollw这个标签,把一些对提升网站SEO没多大价值的页面链接加上这个标签,搜索引擎自然节约了很多无效的爬行时间,对你网站的有效抓取就会提升,这一点,在实践操作中,是非常有用的,特别是对于新站,以及一些庞大的B2C或一些海量数据的信息类网站,合理利用nofollow标签,提升对搜索引擎友好度,可以使你的有效抓取获得提升,对提升你的SEO流量也是有非常大的帮助的。
nofollow是HTML元标签(meta)的content属性和链接标签(a)的rel属性的一个值,告诉机器(爬虫)无需追踪目标页,为了对抗blogspam(博客垃圾留言信息),Google推荐使用nofollow,告诉搜索引擎爬虫无需抓取目标页,同时告诉搜索引擎无需将的当前页的Pagerank传递到目标页。但是如果你是通过sitemap直接提交该页面,爬虫还是会爬取,这里的nofollow只是当前页对目标页的一种态度,并不代表其他页对目标页的态度。nofollow的使用
nofollow有两种用法:
1.用于meta元标签:<meta name="robots" content="nofollow" />,告诉爬虫该页面上所有链接都无需追踪。
2.用于a标签:<a href="login.aspx" rel="nofollow">登录</a>,告诉爬虫该页面无需追踪。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)