但是很多人采集的时候,什么也不改,就是纯采集,这种情况就比较棘手了。纯采集的内容,对于搜索引擎来说,至少有两个理由,让你的页面不被收录:
1、内容重复太高了
纯采集因为采集源单一,内容往往高度重复的,对于搜索引擎来说,重复的内容=垃圾。
2、你一采就是成千上W条的内容
搜索引擎工程师也不是吃白饭的,别人发展一年网站,都未必有1万条内容,可你一天之内就能实现一万条,不是采集是什么?
所以要采集的话,不能一次性采集太多,更不能选择单一采集源。
这时你要考虑一件事情,你这个网站打算经营多久时间?将采集的数量,降低下来,平均的分配到每一天里面。对于采集源的选择,我建议网站每一个栏目,都去选择一个不同采集源,切忌整个网站采集一个网站的内容,这样的话,重复度会非常高。
关于采集源的挑选办法:
1、至少3~5个后备采集源
建议每一个栏目都采集不同的网站,那么你需要为不同栏目,分别准备3~5个不同网站的采集源。
2、找文章
在准备的几个采集源里,随便挑个文章,从中复制一句话,在百度或谷歌进行搜索。
3、看结果
只要有这篇文章的网站,就会被列出来,那么你会看见一大堆标题相同网页,但是要注意!还是有一部分是编辑手工调整过标题的,嘻嘻!我们的目标就是采集这些经过手工编辑的网站。
另外注意的是,网站采集如果做内部链接的话,一篇文章建议3个站内链接为佳,外部链接不要超过两个,否则文章根本就没什么权重了,随便提下我以前写过,关于增加内页权重办法,感兴趣的朋友可以看下。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)