在网站优化过程中,搜索引擎并不喜欢重复内容的收录,一直强调的也是原创,那为什么网站同一页面还会重复收录呢?
一般后缀出现了一个问号或者其他的字符串,是因为百度收录文章的同时,会给该篇文章加一个标签,但是访问网站的时候,会自动跳转回来原来的网站,首页或者内页,至于内页的链接被收录到首页有可能是因为该篇文章设置在首页上显示,所以最终的链接地址指向了首页。
1.搜索引擎识别问题—搜索引擎毕竟只是人为编写的一套规则,做不到充分的识别,所以导致部分URL地址的内容重复收录。
2.程序设计问题—有些程序在设计中为了“预览”方便在后台存在动态页面。但因设计不当,导致搜索引擎依旧通过目录的索引便可发现这一存在,进而对其索引收录。
3.模板问题—在模板制作中常常易忽视这一问题,最后模板完成后既存在动态页面,又存在静态页面,如此怎能不被搜索引擎重复收录呢?
4.网站改版—网站改版可能会导致一些URL地址的重复收录。
二、网站页面重复收录该如何处理?
可以从以下四个方面着手:
1.URL标准化
在网站建设过程中尽量统一URL地址,勿使用动态页面进行链接,一来是搜索引擎青睐静态页面,另一方面也可以防止相同内容被搜索引擎重复收录。
2.利用robots.txt屏蔽动态文件
利用robots.txt进行动态文件的屏蔽,如:“Disallow: /?”即屏蔽了根目录下带”?”的页面,这个可以自己灵活设置。
3.及时的清除缓存
每个网站都会带有两个网址,一般网站更新文章后都需要生成静态的网址,本身就存在一个动态的,自然生成静态后就会多出一个网址,这样的话,如果没及时清除缓存,就可能使得同一个页面的静态,动态URL网址都被收录,因为这搜索引挚把同一篇文章的两个网址看作是独立的,自然就两个都被收录了。所以,及时清除缓存可以很大程度上减少网页被重复收录。
4.利用网站地图引导蜘蛛
网站地图的作用不单单是把整站的内容进行归纳,而且还可以让蜘蛛爬行更加的顺畅无阻,有序的抓取网站内的各个页面,从而也能减少蜘蛛对网站页面重复收录的概率。
网站要想有SEO流量,收录是第一个重要的步骤,没有收录那么排名、点击都是空谈,所以收录的优化工作非常的重要,仅仅在收录这一环节,都有许多工作可以去做,那么网站快速收录的方法有哪些?1、在首页展示未被抓取的网页的URL网站首页的权重一般都比较高,搜索引擎蜘蛛过来抓取都是通过首页,才进入各个分页面进行抓取。因此站长需把未抓取的URL列表提取出来,然后把这些URL在首页展示,以增加被搜索引擎抓取的机会,许多网站之所以在首页有最新文章版块、随机展示版块,其实也大都是为了增加被搜索引擎抓取的机会,从而增加网站页面的收录,首页的权重是一个网站中最高的URL页面,也是蜘蛛最活跃的页面,所以在首页展示可以增加收录。2、灵活调整搜索引擎的抓取频率在谷歌网站管理员工具中,其中有一项就是可以根据自己网站的情况,调整搜索引擎的抓取频率,在默认的情况下,谷歌是按照网站的服务器承认情况,来调整它的抓取频率,它的原则就是在服务器能够承受的情况下、尽可能多的去抓取。因此,如果想提高它的抓取频率,可以在这谷歌网站管理同工具里边进行调整,当然这个只能是针对谷歌的。3、多发一些网站列表页URL的外链在SOSO的官方SEO指南中,曾经提到过这一点,可以专注于网站的列表页,给一些列表页多发一些外链,因为列表页里边的有效URL比较多,当搜索引擎蜘蛛抓取到列表页后,就会抓取列表页中的产品URL,从而增加网站的收录。4、分析搜索引擎的抓取日志在网页被收录之前,首先需要搜索引擎来爬行、抓取的,当搜索引擎抓取到网站页面后,而且它觉得网站文章质量符合它的收录标准的时候,它就会把网页收录进它的索引库、然后经过处理给予网站网页相应的关键词的排名,而分析日志,可以清楚的知道哪些页面被抓取了,哪些页面没有被抓取,网站的每个目录的抓取情况,这样就可以采取相应的措施来促进搜索引擎的收录。临沂nanke医院哪家好欢迎分享,转载请注明来源:夏雨云
评论列表(0条)