但是很多人采集的时候,什么也不改,就是纯采集,这种情况就比较棘手了。纯采集的内容,对于搜索引擎来说,至少有两个理由,让你的页面不被收录:
1、内容重复太高了
纯采集因为采集源单一,内容往往高度重复的,对于搜索引擎来说,重复的内容=垃圾。
2、你一采就是成千上W条的内容
搜索引擎工程师也不是吃白饭的,别人发展一年网站,都未必有1万条内容,可你一天之内就能实现一万条,不是采集是什么?
所以要采集的话,不能一次性采集太多,更不能选择单一采集源。
这时你要考虑一件事情,你这个网站打算经营多久时间?将采集的数量,降低下来,平均的分配到每一天里面。对于采集源的选择,我建议网站每一个栏目,都去选择一个不同采集源,切忌整个网站采集一个网站的内容,这样的话,重复度会非常高。
关于采集源的挑选办法:
1、至少3~5个后备采集源
建议每一个栏目都采集不同的网站,那么你需要为不同栏目,分别准备3~5个不同网站的采集源。
2、找文章
在准备的几个采集源里,随便挑个文章,从中复制一句话,在百度或谷歌进行搜索。
3、看结果
只要有这篇文章的网站,就会被列出来,那么你会看见一大堆标题相同网页,但是要注意!还是有一部分是编辑手工调整过标题的,嘻嘻!我们的目标就是采集这些经过手工编辑的网站。
另外注意的是,网站采集如果做内部链接的话,一篇文章建议3个站内链接为佳,外部链接不要超过两个,否则文章根本就没什么权重了,随便提下我以前写过,关于增加内页权重办法,感兴趣的朋友可以看下。
采集的信息需要与网站的主题相关比较好,如果你的站是刚刚建立的,劝你少采集一些或者手工来加权重高一点的网站你最好定一个主题,相对于比较泛泛的网站,专业度比较强的网站更好一些。其实网站的内容相关性还是比较重要的,如果你网站的内容很强,即使在seo方面做的是很好也可以有一个比较好的表现,毕竟在网站排名算法里,网站内容是最重要的一个方面整个网站内容或者是大部分内容都是采集的,影响很大。如果你继续采集,搜索引擎就会认为你是一个低质量的采集站,这样以后你的收录更困难。所以从现在开始要不断坚持原创或高质量的伪原创,以前收集的也不要删了,以免做太大的改动最好挑选出很多网站来进行采集,不要抓住一个网站去每天采集,这样下来你的网站大部分内容就和这个网站的一部分内容相似了,这样也是不好的采集是可以的,但是在适当的写一些伪原创和原创的文章进去,这样也是可以的,不过本人建议还是不要采集,毕竟没有苦头也是尝不到甜头的。欢迎分享,转载请注明来源:夏雨云
评论列表(0条)