1、URL地址优化
为网站上的文件创建具有良好描述性的分类名和文件名,不仅可以更好地组织网站结构,还有助于搜索引擎更有效地抓取文件。虽然搜索引擎能够抓取复杂的URL,但提供相对简单的URL,对于用户和搜索引擎来说都是有帮助的。
优化URL结构的主要方法有,网站自始至终都使用一个URL地址,不要来回变更地址,如果用带www的域名地址,则将不带www的域名使用301重定向技术重定向到主要地址,避免使用大小写字母的URL,网站的URL尽量使用静态URL,避免使用动态URL,URL越短越好,URL的内容使用拼音或者英文最好,方便记忆。
对于动态网站来说,使用伪静态技术可以让网站的外部看起来和静态网站一样,利于搜索引擎的索引。
2、目录结构
目录结构最好用一级到二级,不要超过三级。目录的组织方式尽量采用:首页-》栏目页-》内容页。目录名采用拼音或者英文。避免使用多层嵌套的子目录。
3、robots.txt
robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。
当我们不希望网站中的某些页面被搜索引擎抓取,也许这些网页在搜索结果中出现对于用户来说并没多大用处,就可以把这些页面放在robots.txt里,这可以保证网站的某些内容不出现在搜索结果中。
4、Sitemaps
Sitemaps可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,搜索引擎就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”搜索引擎,方便搜索引擎进行索引。
Sitemaps文件通常是XML格式的,格式比较简单,Sitemaps协议以 <urlset>开始标记开始,以 </urlset>结束标记结束。 每个网址包含一个作为父标记的 <url>条目。 每一个 <url>父标记包括一个 <loc>子标记条目。<loc>是网页文件的网址。此网址应以http开始并少于2048个字符。 <lastmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。
5、网站导航
网站的导航功能对于帮助用户迅速找到他们想要的内容来说是很重要的,它对帮助搜索引擎理解该网站有哪些重要内容同样非常重要。网站地图是将网站上用于展示网站结构的网页以层级式列表的方式展示。网站导航的主要目的是为了方便用户,但同时它也有利于搜索引擎对整个网站页面更全面地抓取。
主要的网站导航方法有,创造一个自然的层叠结构的网站地图页面,这个导航页面可以让用户很容易地从主干页面找到他们需要的特定内容,有必要的话可以在保证内部链接结构合理的基础上添加导航页。
使用面包屑(breadcrumb)导航模式,面包屑导航是指在网页顶端或者底部放置的一排内部链接,它使用户可以方便地回到上一层结构中的网页或者主页。大多数面包屑导航通常会从最具概括性的页面开始(通常是主页),越往右指向的页面内容越具体,例如“首页-》栏目-》具体文章标题”。
7、Nofollow的使用
nofollow标签是由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响,减少博客的垃圾留言,目前百度、Google、Yahoo、微软都支持这一标签。当超级链接中出现nofollow标签后,搜索引擎会不考虑这些链接的权重,也不用使用这些链接用于排名。
nofollow标签通常有两种使用方法:一种方法是将"nofollow"写在网页上的meta标签上,用来告诉搜索引擎不要抓取网页上的所有外部和包括内部链接。例如:<meta name="robots” content="nofollow” />。另一种方法是将"nofollow"放在超链接中,告诉搜索引擎不要抓取特定的链接。例如:<a rel="nofollow" href="url">。
需要注意的是,如果一个网站链向了某些被搜索引擎认为是垃圾网站的地址,那么这个网站的权重也会受到影响。因此对于一个网站来说,为了安全保险起见,所有那些有可能是第三方提交的超级链接都应该添加nofollow标签。
8、404页面
404 网页是用户尝试访问网站不存在的网页(由于用户点击了损坏的链接、网页已被删除或用户输入了错误的网址)时看到的页面。之所以称为 404 网页,是因为针对丢失网页的请求,网络服务器会返回 404 HTTP 状态代码,表明该网页未找到。
用户偶尔会因点击失效的链接或输入错误的URL而访问一些在网站域名下但并不存在的页面。使用自定义404网页能有效地帮助用户回到网站中有效页面,大大提高用户体验。404网页最好能提供回到网站主页的链接以及到网站中热门内容页面的链接。
通常用户最好创建一个自定义的 404 网页,以便获得这部分用户流量。一个好的自定义 404 网页可以帮助用户找到所需信息、提供其他实用内容及吸引用户进一步浏览用户的网站。
不过,很多网站设计的404页面都很简单,不少网站为了不损失流量,在404页面里面自动重定向到首页的方式,这并不是一个改善用户体验的设计方法。
9、统计代码的使用
网站统计分析工具可以深入了解用户是如何找到网站以及他们有哪些行为习惯,同时发现网站上最受欢迎的内容,还可以衡量对网站进行优化之后的效果(例如,修改标题和描述性的元标签有没有帮助增加从搜索引擎带来的流量?),还能搞清楚访问者来自哪里,访问者在寻找什么,访问者从那些页面进入,从哪些页面退出。
使用网站统计分析工具的前提就是要在网站增加统计代码,目前较为常见的统计工具有百度统计、谷歌分析等。为了不影响网站的加载速度,统计代码最好放在网站底部。
移动端与PC端转换
①确保在手机网站或者PC端网站各个页面上有相应的导航或者提示链接,让用户可以在手机版和PC版进行切换,也便于搜索引擎更好的收录。
②百度官方曾声明,对于移动站点,当baiduspider ua或者其它无法确定来源的ua访问时,建议默认情况下直接返回html5 或xhtml 类型的移动页面,不要重定向到PC页面。
手机网站适配声明
手机页面进行合适的 DOCTYPE 声明有助于搜索引擎识别该页面是否适合手机浏览。<!DOCTYPE>声明位于文档中的最前面的位置,处于标签之前。例如:
xhtml 协议的手机页面中可以使用如下 DOCTYPE:
<!DOCTYPE html PUBLIC “-//WAPFORUM//DTD XHTML Mobile 1.0//EN” “http://www.wapforum.org/DTD/xhtml-mobile10.dtd”>
wml协议的手机页面可以使用如下DOCTYPE:
<!DOCTYPE wml PUBLIC “-//WAPFORUM//DTD WML 1.1//EN” “http://www.wapforum.org/DTD/wml_1.1.xml”>
而HTML5协议的DOCTYPE为:
<!DOCTYPE HTML>
url链接规范化
①对于多个板块的二级域名或者目录来说,使用规范、简单的url,尽量去除与页面内容无关的参数,如用来区分手机型号、区分访问用户,方便统计等的参数。如手机版的“百度知道”http://wapiknow.baidu.com/
②页面url链接跳转最好是正常格式的目标url,不要中间进行跳转。
定位和页面设计
无论是PC端还是移动端,网站都要考虑清楚消费群体的定位问题。虽然智能手机用户数量非常普及,但是要明白中国的大部分手机用户使用的还是2G网络,一直高 喊的3G、4G手机用户只有大约15%左右。所以,在页面设计时,要考虑到用户打开网页的时长,一些炫丽的flash、JS等建议还是不用为好。这不仅仅 是用户体验的问题,也是尽量减少百度索引抓取的工作,让百度蜘蛛尽可能多的爬行和收录页面。
提交移动端Sitemap
针对移动端页面也需要提交移动的sitemap,方便移动spider抓取,主要分为url级别sitemap和pattern级别sitemap
url级别sitemap:通过XML文件描述url级别的PC页与手机页的对应关系。
pattern级别sitemap:一个pattern级别的对应关系,往往可以表示成千上万的url对应关系。通过pattern的形式批量的提交对应关系,能够大大减少站长提交的数据量。
移动的sitemap形式如下:
<url>
<loc>http://m.example.com/index.html</loc>
<mobile:mobile type="mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
html标签
与PC端优化一致,使用关键词和描述的时候尽量准确的描述出网站所讲的内容
Title文案区别PC端,尽量简短,体现关键词,8个汉字以内把页面内容描述清楚并且包括频道名称,避免所有的页面描述使用同一个文案。
专属的手机网站头部标签。对于手机网站的首页或者频道首页的网 页代码中的keywords、description最好加上与PC端有所区别的meta标签和关键词,在每个页面的关键字及描述像做传统PC端网站一样,做好针对性的填写工作。对搜索结果的展现(摘要)以及优化工作大有帮助。
robots设置
robots 设置上最好不要任何限制,让所有搜索引擎抓取。另外小生在这里纠正一个很多站长想当然的误区,百度官方声明百度spider 的爬虫UA是Baiduspider(www 和wap 一致),个别站长经常会误认为百度手机爬虫的UA是baiduspider-mobile,其实没这回事。
超链接和纯文本链接都一样额,都能被搜索引擎抓取到,不过如果你的网站地图除了给搜索引擎看 还给用户看的话,还是做成超链接比较好,用户体验也好一些。
标准sitemap协议说明:
1.Sitemap采用.xml格式
2.Sitemap可以使用utf-8编码和GBK编码
3.为节省带宽可以采用gzip格式压缩Sitemap文件
4.一个Sitemap文件中最多可包含50000个url,并且应小于10MB。
XML标签说明:
<url>
<loc>https:// www.171tiyu.com/</loc>
<priority>1.00</priority>
<lastmod>2019-03-19</lastmod>
<changefreq>Always</changefreq>
</url>
文本格式sitemap说明:
您可以提供纯文本文件,其中每行包含一个网址。
文本文件格式举例:网页链接
此文本文件需要遵循以下:
文本文件每行都必须有一个网址。网址中不能有换行。
您必须制定完整的网址,包括http。
每个文本文件最多可包含50,000个网址,并且不大于10MB(10,485,760字节)。如果网站所包含的网址超过50,000个,则可将列表分割成多个文本文件,然后分别添加每个文件。
文本文件需使用UTF-8编码或GBK编码。
文本文件不应包含网址列表以外的任何信息。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)