老卢SEO教程第8节:HTTP状态码是什么意思

老卢SEO教程第8节:HTTP状态码是什么意思,第1张

HTTP状态码就是在通过一些数字来判断网站链接是什么状态

一些常见的状态码为:

200 - 服务器成功返回网页 404 - 请求的网页不存在 503 - 服务不可用

所有状态解释:

1xx(临时响应)

表示临时响应并需要请求者继续执行操作的状态代码。

代码 说明

100 (继续) 请求者应当继续提出请求。 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。

101 (切换协议) 请求者已要求服务器切换协议,服务器已确认并准备切换。

2xx (成功)

表示成功处理了请求的状态代码。

代码 说明

200 (成功) 服务器已成功处理了请求。 通常,这表示服务器提供了请求的网页。

201 (已创建) 请求成功并且服务器创建了新的资源。

202 (已接受) 服务器已接受请求,但尚未处理。

203 (非授权信息) 服务器已成功处理了请求,但返回的信息可能来自另一来源。

204 (无内容) 服务器成功处理了请求,但没有返回任何内容。

205 (重置内容) 服务器成功处理了请求,但没有返回任何内容。

206 (部分内容) 服务器成功处理了部分 GET 请求。

3xx (重定向)

表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向。

代码 说明

300 (多种选择) 针对请求,服务器可执行多种操作。 服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择。

301 (永久移动) 请求的网页已永久移动到新位置。 服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。

302 (临时移动) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

303 (查看其他位置) 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。

304 (未修改) 自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容。

305 (使用代理) 请求者只能使用代理访问请求的网页。 如果服务器返回此响应,还表示请求者应使用代理。

307 (临时重定向) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

4xx(请求错误)

这些状态代码表示请求可能出错,妨碍了服务器的处理。

代码 说明

400 (错误请求) 服务器不理解请求的语法。

401 (未授权) 请求要求身份验证。 对于需要登录的网页,服务器可能返回此响应。

403 (禁止) 服务器拒绝请求。

404 (未找到) 服务器找不到请求的网页。

405 (方法禁用) 禁用请求中指定的方法。

406 (不接受) 无法使用请求的内容特性响应请求的网页。

407 (需要代理授权) 此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。

408 (请求超时) 服务器等候请求时发生超时。

409 (冲突) 服务器在完成请求时发生冲突。 服务器必须在响应中包含有关冲突的信息。

410 (已删除) 如果请求的资源已永久删除,服务器就会返回此响应。

411 (需要有效长度) 服务器不接受不含有效内容长度标头字段的请求。

412 (未满足前提条件) 服务器未满足请求者在请求中设置的其中一个前提条件。

413 (请求实体过大) 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。

414 (请求的 URI 过长) 请求的 URI(通常为网址)过长,服务器无法处理。

415 (不支持的媒体类型) 请求的格式不受请求页面的支持。

416 (请求范围不符合要求) 如果页面无法提供请求的范围,则服务器会返回此状态代码。

417 (未满足期望值) 服务器未满足"期望"请求标头字段的要求。

5xx(服务器错误)

这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。

代码 说明

500 (服务器内部错误) 服务器遇到错误,无法完成请求。

501 (尚未实施) 服务器不具备完成请求的功能。 例如,服务器无法识别请求方法时可能会返回此代码。

502 (错误网关) 服务器作为网关或代理,从上游服务器收到无效响应。

503 (服务不可用) 服务器目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。

504 (网关超时) 服务器作为网关或代理,但是没有及时从上游服务器收到请求。

505 (HTTP 版本不受支持) 服务器不支持请求中所用的 HTTP 协议版本。

网站日志中数据量过大,所以我们一般需要借助网站日志分析工具来查看。常用的日志分析工具有:光年日志分析工具、web log exploer 、WPS表格等

117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatibleMSIE8.0Windows NT 5.1Trident/4.0AskTbCS-ST/5.11.3.15590.NET CLR 2.0.50727Alexa Toolbar)"

分析:

117.26.203.167:来访ip

02/May/2011:01:57:44 -0700 访问日期 -时区

GET/index.php HTTP/1.1 根据HTTP/1.1 协议 抓取(域名下)/index.php 这个页面(GET表示服务器动作)

500:服务器响应状态码

服务器响应状态码通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证 明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url已经做了301重定向(永久性)处理,302则是暂时性重 定向。404则代表所访问的页面已经不存在了,或者说访问的url根本就是个错误的。500则是服务器的错误。

19967:表示抓取了19967个字节

Mozilla/4.0 (compatibleMSIE 8.0Windows NT 5.1Trident/4.0

AskTbCS-ST/5.11.3.15590.NET CLR 2.0.50727Alexa

Toolbar表示访问者使用火狐浏览器及Alexa Toolbar 等访问端信息

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知,抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断,当然,我们希望百度蜘蛛每日抓取的次数越多越好,这里分享下如何分辨百度蜘蛛《如何分辨真假百度搜索引擎蜘蛛IP》。

有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。

我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。

蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页

一、SEO工作的核心所在①排名是基于搜索概率排序

百度排名算法关键点是基于搜索概率排序,比如搜索“苹果”这个关键词,一定是苹果手机的页面排名在前面。如果做一个关于苹果水果的网站,并用大量高级资源来支撑它的排名,也无法让这个页面排名百度第一。因为这个词,用户想要搜索苹果手机的概率显然要远大于搜索苹果水果的概率。郑州SEO-雪山SEO博客指出:百度排名算法毕竟是机器,不是智能的,所以它只能优先将搜索概率高的页面,排在前面。这是目前最佳的排名方案。推荐文章:雪山SEO教你网站文章如何才能秒收录!

②、SEO流量公式

SEO流量=搜索需求覆盖率+收录量+排名+点击率。搜索需求覆盖率简单是说就是有用户需求在百度里有搜索指数的词,前三者相加就是网站关键词词库排名,关于词库后面具体SEO操作中会详细提到。点击率是浏览页面用户的对网页操作数据的体现,比如页面停留时间,页面PV,页面跳出率等数据。能很好的执行这个SEO流量公式,当然可以带来很可观的SEO优化效果。

二、SEO优化的具体操作计划1.网站基础SEO细节优化

鉴于SEO优化细节很多,妇科站还未开通的原因,这里只列举一些比较关键的SEO细节。

①、205妇科首页,栏目页,专题页,三大标签选择。

②、首页主权重关键词布局设置,关键词密度设置。至于首页模块布局的合理性,一旦页面前端程序员设计出来后,就很难改变。可以到网站运行后期,再慢慢调整。。

③、网站结构这点用dedcms来做站,基本没有什么问题,扁平化树形结构都符合。

④、面包屑导航和次导航的链接权重传递设置。⑤、H1标签的使用。⑥、ALT标签的使用。

⑦、nofollow标签首页集权设置。

⑧、内链的权重传递设置。比如文章页下面的相关阅读文章模块设置等。⑨、URL是否标准化设置。301集权等。⑩、404页面设置,robots.txt文件的设置工作结束时间:网站上线后一周内解决。2.网站关键词库建立①什么是关键词词库?

简单的说就是免费的竞价词库。关键词库包括首页三大标签里的关键词,更重要的是文章页的长尾关键词。毕竟这种站点,首页三大标签关键词所带来的流量是极其有限的。如何不断拓展专题页,文章页的关键词数量,是这种站点工作重心所在。这里再提到上面的SEO流量公式,搜索需求覆盖率+收录量,这是建立关键词词库的基础。

②205妇科如何建立关键词词库?

可以通过百度指数,百度下拉菜单,百度相关搜索,百度凤巢,爱站网同行关键词,站长之家词库等工具查询。

前期工作重心:全国同行网站关键词库的采集和挖掘,是网站开始优化后,每天必做的事情。提取到关键词库,将其拓展延伸更多的关键词,然后让网编去采编文章。(需要网编配合)

工作结束时间:无,每天必做的事。3.提高网站收录率

词库建立后,第二步的工作是提高页面收录率,页面不收录,词库选的再好,文章编辑的质量再高,也没什么用。

那如何提高页面收录率?

①、需要技术支持,写出网站地图程序。更有利于百度的抓取。

②、提高网编的文章质量,优先保证原创度,或者伪原创度。然后再来做文章的采编成本。对于百度来说,文章的采编成本跟文章的质量是挂钩的。比如你直接复制一篇文章,只要1秒时间,而你对复制来的文章进行二次创作,加上图文并茂什么的,这样花的时间成本肯定是很高的。现在的百度是可以通过机器学习算法,对此进行判断。这点需要(竞价+网编的配合)

③、通过新闻源给所编辑的文章加上链接,吸引百度蜘蛛爬取。

④、保证稳定的更新频率,更有利于文章的收录。这里有个建议,周六周日网编可以分开休息。保证每天都有人更新文章,百度蜘蛛每天都会来爬取。这样做的好处,网站很容易形成秒收,就是一发布就几分钟后就收录。

工作结束时间:无,给文章带新闻源链接,每天都要做。4.提高网站外链+友情链接建设

外链是网站的外部投票,正是基于投票原理,虽然百度官方出台信息说,外链作用被弱化,但是在同等优化条件下,外链质量和数量占优的网站,显然是可以获得更好的排名。

具体操作:

①、培养新浪,网易,搜狐,天涯等大站博客。②、培养SNS,豆瓣,人人,开心网的账号③、培养西祠等大型论坛账号④、培养各地区医疗行业论坛账号

工作结束时间:无,每天在这些账号下发文,前一周先不要带连接,一周后可以适当的带上网站的外链。友情链接可以每天加入一些友情链接群,保证每周可以和同行网站换3-4个友情链接。到30个左右可以暂停。推荐文章:教你如何最快的发外链引蜘蛛

5.网站用户体验研究

用户体验,需要结合网站上线后,统计代码后台的数据来结合分析。工作结束时间:无,一般一周对数据进行一次分析,写成报表。6.竞争对手分析

竞争对手分析,包括分析网站的关键词词库,网站的收录,网站的外链,网站首页关键词排名等。

工作结束时间:无,一周跟踪一次,写成报表。7.网站品牌外推

在免费或者付费的新闻源上,发布网站信息。提高网站品牌曝光率。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/757364.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-17
下一篇2023-08-17

发表评论

登录后才能评论

评论列表(0条)

    保存