爬行指的是搜索引擎蜘蛛从已知页面上解析出链接偏向的URL,随后顺着链接发觉新页面(也就是说链接偏向的URL)的过程。这样的话,蛛蛛并非发觉新URL马上就爬过去抓取新页面,只是把发觉的URL储放到待抓地址库中,蜘蛛依照必须次序从详细地址库中获取要爬取的URL。
网站排名好不好,流量多不多,其中一个关键的因素就是网站收录如何,尽管收录不能直接决定网站排名,但是网站的基础就是内容,没有内容想做好排名难上加难,好的内容能得到用户和搜索引擎的满意,可以让网站加分,从而促进排名,扩大网站的曝光页面。具体参看一下几点:
1.网站及页面权重。
权重高、资格老、有权威的网站蜘蛛是肯定特殊对待的,这样的网站抓取的频率非常高,搜索引擎蜘蛛为了保证高效,对于网站不是所有页面都会抓取的,而网站权重越高被爬行的深度也会比较高,相应能被抓取的页面也会变多,这样能被收录的页面也会变多。
2.网站服务器。
网站服务器是网站的基石,网站服务器如果长时间打不开,那么这相当与闭门谢客,蜘蛛想来也来不了。百度蜘蛛也是网站的一个访客,如果服务器不稳定或是比较卡,蜘蛛每次来抓取都比较艰难,并且有的时候一个页面只能抓取到一部分,这样久而久之,百度蜘蛛的体验越来越差,自然会影响对网站的抓取
3.网站的更新频率。
蜘蛛每次爬行都会把页面数据存储起来。如果第二次爬行发现页面与第一次收录的完全一样,说明页面没有更新,蜘蛛也就没有必要经常抓取了。页面内容经常更新,蜘蛛就会更加频繁的访问页面,但是蜘蛛不是你一个人的,不可能就在这蹲着等你更新,所以我们要主动向蜘蛛示好,有规律的进行文章更新,这样蜘蛛就会根据你的规律有效的过来抓取,不仅让你的更新文章能更快的抓取到,而且也不会造成蜘蛛经常性的白跑一趟。
4.文章的原创性。
优质的原创内容对于百度蜘蛛的诱惑力是非常巨大的,蜘蛛存在的目的就是寻找新东西,所以网站更新的文章不要采集、也不要每天都是转载,我们需要给蜘蛛真正有价值的原创内容,蜘蛛能得到喜欢的,自然会对你的网站产生好感,经常性的过来觅食。
5.扁平化网站结构。
蜘蛛抓取也是有自己的线路的,在之前你就给他铺好路,网站结构不要过于复杂,链接层次不要太深,如果链接层次太深,后面的页面很难被蜘蛛抓取到。
6.网站程序。
在网站程序之中,有很多程序可以制造出大量的重复页面,这个页面一般都是通过参数来实现的,当一个页面对应了很多URL的时候,就会造成网站内容重复,可能造成网站被降权,这样就会严重影响到蜘蛛的抓取,所以程序上一定要保证一个页面只有一个URL,如果已经产生,尽量通过301重定向、Canonical标签或者robots进行处理,保证只有一个标准URL被蜘蛛抓取。
7.外链建设。
大家都知道,外链可以为网站引来蜘蛛,特别是在新站的时候,网站不是很成熟,蜘蛛来访较少,外链可以增加网站页面在蜘蛛面前的曝光度,防止蜘蛛找不到页面。在外链建设过程中需要注意外链的质量,别为了省事做一些没用的东西,百度现在对于外链的管理相信大家都知道,我就不多说了,不要好心办坏事了。
8.内链建设。
蜘蛛的爬行是跟着链接走的,所以内链的合理优化可以要蜘蛛抓取到更多的页面,促进网站的收录。内链建设过程中要给用户合理推荐,除了在文章中增加锚文本之外,可以设置相关推荐,热门文章,更多喜欢之类的栏目,这是很多网站都在利用的,可以让蜘蛛抓取更大范围的页面。
9.首页推荐。
首页是蜘蛛来访次数最多的页面,也是网站权重最高的页面,可以在首页设置更新版块,这样不仅能让首页更新起来,促进蜘蛛的来访频率,而且可以促进更新页的抓取收录。同理在栏目页也可以进行此操作。
10.检查死链,设置404页面
搜索引擎蜘蛛是通过链接来爬行搜索,如果太多链接无法到达,不但收录页面数量会减少,而且你的网站在搜索引擎中的权重会大大降低。蜘蛛在遇见死链就像进了死胡同,又得折返重新来过,大大降低蜘蛛在网站的抓取效率,所以一定要定期排查网站的死链,向搜索引擎提交,同时要做好网站的404页面,告诉搜索引擎错误页面。
11.检查robots文件
很多网站有意无意的直接在robots文件屏蔽了百度或网站部分页面,却整天在找原因为什么蜘蛛不来抓取页面,百度是怎么收录你的网页?所以有必要时常去检查一下网站robots文件是否正常。
12.建设网站地图。
搜索引擎蜘蛛非常喜欢网站地图,网站地图是一个网站所有链接的容器。很多网站的链接层次比较深,蜘蛛很难抓取到,网站地图可以方便搜索引擎蜘蛛抓取网站页面,通过抓取网站页面,清晰了解网站的架构,所以建设一个网站地图不仅提高抓取率还能获得蜘蛛好感。
13.主动提交
每次更新完页面,主动把内容向搜索引擎提交一下也是一个不错的办法,只不过不要没收录就一直去提交,提交一次就够了,收不收录是搜索引擎的事,提交不代表就要收录。
14.监测蜘蛛的爬行。
利用网站日志监测蜘蛛正在抓取哪些页面、抓取过哪些页面,还可以利用站长工具对蜘蛛的爬行速度进行查看,合理分配资源,以达到更高的抓取速度和勾引更多的蜘蛛。
总结:网站要获得更多的收录就需要做好搜索引擎蜘蛛的抓取优化工作,只有提高了网站整体的抓取率,才能提高相应的收录率,这样网站的内容才能获得更多展示和推荐,网站排名才能得到提高。底子打好才能往上爬,基础建设始终是网站优化的根本。
一、网站内部优化01)meta标记设置:title、keywords、description标志一定设置好,是告诉搜索引擎网站主要是干什么用的。
02)网站内部链接:包含关联性网页链接、相关文章链接、相关文章标签链接、各导航链接及图片链接。
03)网站内容更新:每日始终保持网站内部的内容更新至少1-2条原创文章,并非采集或直接复制过来文章。
04)代码缩减改善:网站首页唯一性,网站内页链向主页,301、404等改善
二、外部结构优化
01)外部链接:尽量保持网页链接的多样性如博客、论坛、B2B、新闻、分类信息、贴吧、问答、百科全书、社区、空间、微信、微博等。
02)外链构建:每天添加一定数量的外链,稳步提高关键词排名。
03)友情连接:与一些与你的网站相关性高、整体质量好的网站交换友情链接,巩固稳定的关键词排名。
三、网页链接优化
网站优化结构
01)建立蜘蛛爬行地图
如果可能的话,最好为网站建立一个完整的蜘蛛爬行地图sitemap,同时,
蜘蛛爬行地图的链接放在主页上,使百度搜索引擎能够轻松地找到和捕获网站所有的网页信息。
02)每个网页建立当前端,点击三次就能直达网站首页。
03)网站栏目导航一定要用文字+链接。
04)网站导航中的链接文字应当准确无误叙述栏目的内容。
05)整站的PR传递和流动。
06)网页的关联性网页链接。
百度搜索引擎如何抓取网页
1)百度搜索引擎如何爬取(按什么规则,怎样爬取)
2)物理及网页链接结构
3)URL静态化链接路径
4)绝对路径和相对路径
5)内链的权重分配及蜘蛛爬行地图
6)避免蜘蛛陷阱
网页链接结构
网络结构的第二种结构形式:网页链接结构又称逻辑结构,即网站内部链接形成的网络图。
更合理的链接结构通常是树形结构。
四、关键词选择
01)用百度推广助手中关键词工具开展选择适合推广的词;
02)做调研并选择精准关键词;
03)通过查看统计日志选择有用关键词;
04)网站长尾关键词;
05)将关键词开展多方面排列与组合;
06)尽可能不要用行业领域通用关键词;
07)善于充分利用所在地域的关键词(昆明网站建设、昆明网站制作);
08)判定关键词的市场价值;
09)长尾关键词的挑选;
10)关键词的实效性;
11)深入分析竞争者;
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)