网站日志中数据量过大,所以我们一般需要借助网站日志分析工具来查看。常用的日志分析工具有:光年日志分析工具、web log exploer 、WPS表格等
117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatibleMSIE8.0Windows NT 5.1Trident/4.0AskTbCS-ST/5.11.3.15590.NET CLR 2.0.50727Alexa Toolbar)"
分析:
117.26.203.167:来访ip
02/May/2011:01:57:44 -0700 访问日期 -时区
GET/index.php HTTP/1.1 根据HTTP/1.1 协议 抓取(域名下)/index.php 这个页面(GET表示服务器动作)
500:服务器响应状态码
服务器响应状态码通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证 明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url已经做了301重定向(永久性)处理,302则是暂时性重 定向。404则代表所访问的页面已经不存在了,或者说访问的url根本就是个错误的。500则是服务器的错误。
19967:表示抓取了19967个字节
Mozilla/4.0 (compatibleMSIE 8.0Windows NT 5.1Trident/4.0
AskTbCS-ST/5.11.3.15590.NET CLR 2.0.50727Alexa
Toolbar表示访问者使用火狐浏览器及Alexa Toolbar 等访问端信息
如果你的日志里格式不是如此,则代表日志格式设置不同。
很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。
抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知,抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断,当然,我们希望百度蜘蛛每日抓取的次数越多越好,这里分享下如何分辨百度蜘蛛《如何分辨真假百度搜索引擎蜘蛛IP》。
有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。
我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。
蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页
seo其实是一门科学的学科,seo的流量上涨或者下降其实都是可以找到相关的因素的,了解其中的来源就离不开日志分析,对于网站的数据时实监控,从数据中判断网站的问题所在,然后做出相应的改变。这是我们网站能一直稳定发展从流量的直线下降到回升直到大涨的一个原因所在。每天抓取量,对网站抓取所返回的状态码,去年流量是五万,今年流量到了十万,如果服务器配置没有增加的话,正常来讲响应的时间都会延长,从而流量上升后大幅下降。网站移动端流量404错误页面过多,很多都是pc页面做了完整的优化,移动端这是简单的做了适配或者公用数据库,其实网站日志可以帮助你检测。从而尽早的解决问题,日志检查的周一最好是每天,完成分析成结果的最好每周也做一份。
怎么检测网站SEO效果
对于SEO效果的检测不仅是在检验SEO的成效,更是在准确地统计工作成效等。下面是我整理的网站SEO效果检测的9个基本方法,希望对你有帮助!
(1)使用site指令查询网站收录量,再根据自己的网站实际内容情况,计算收录比例。一般优化好的网站能达到7O%^-80%左右。
(2)特征页面的收录数。收录情况不单单只关注网站首页、栏目首页,还要看看一些特征页面如专题页而以及一些特殊页面的收录情况。查询特征页面收录与否,只要在搜索引擎中输入这个页而的完整地址,没有结果就表示没有被收录.
(3)各分类的收录数.SEO人员可以灵活运用site指令、intitle指令和inurl指令来查询每个分类下的产品页面收录数最。
如:site:www.seozf.com intitle:SEO,此组合命令表示查询已经收录的标题中包含“SEO”这个关键词的页面。
(4)排名检测。一般需要检测的是首页目标关键词、典型分类页而目标关键词、产品页和内容页关键词。
(5)外链数据检测。值得注意的是首页、栏目首页、网站内页,要分析链接诱饵的效果,竞争对手外链有没有增减等。
(6)转化率问题。统计有多少是通过SEO优化而转化过来的销售,同时要研究产品本身的质最、价格、文案写作等。
(7)网站日志。查看网站的服务器日志,很多问题都能在日志中留下痕迹,比如说百度蜘蛛服务器的'IP一般是网通的,所以我们要做的工作就是选择一个网
通的IP来保证蜘蛛顺利爬行。
(8)辅助工具.现在有很多很实用的统计工具,如cnzz, 51la、百度统计等,也能分析检测出很多问题。
(9)平均访问时长、跳出率、热力图等网站基本数据,来分析网的用户体验性怎么样!
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)