搜索引擎的工作原理总共有四步:
第一步:爬行,搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,所以称为爬行。
第二步:抓取存储,搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。
第三步:预处理,搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。
第四步:排名,用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。
不同的搜索引擎查出来的结果是根据引擎内部资料所决定的。比如:某一种搜索引擎没有这种资料,您就查询不到结果。
扩展资料:
定义
一个搜索引擎由搜索器、索引器、检索器和用户接四个部分组成。搜索器的功能是在互联网中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
起源
所有搜索引擎的祖先,是1990年由Montreal的McGill University三名学生(Alan Emtage、Peter
Deutsch、Bill Wheelan)发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件 。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
首先不建议这样设置网站,因为网站都进行了需要登录才能访问,就意味着禁止了蜘蛛抓取内页内容,因为搜索引擎蜘蛛抓取网站页面是根据匿名游客身份抓取的。如果是需要登录才能访问的网站建议可以做以下方面操作:
1、做资讯站点,实现排名引导到登录网站
做开发的内容系统,从而导入流量到这个体系平台上。
2、针对网站进行结构优化,实现半开放一半需要登录模式
就是网站还是要做开发的内容,然后做好流量向导,还有隐私的就做登录接口的形式来做,这样方便优化。
百度seo优化规则一、域名选择
1) 域名尽量简短,方便用户记忆
2) 域名可以和网站域名相呼应
3) 使用任何域名对网站的收录并没有影响
二、服务器和空间租用
1) 选择有实力的正规厂商;
2) 保证用户的访问速度和稳定性
3) 根据网站的规模和提供的服务来决定购买服务器
4) 根据用户群分布选择接入商
三、面向seo的网站建设
(1)良好收录
1) 使用文字而不是flash、图片、js来显示重要内容或链接;
2) 如果必须建立网页,必须建立一个供搜索引擎收录的文字版网页,并已在首页使用文字链接向文字版;
3) Ajax等不被搜索引擎识别的技术,只用在用户需要交互的地方,不要用在希望搜索看到的地方。
4) 不要使用frame和iframe,内容很容易被丢弃;
(2)网站结构
1)确保每个页面至少可以通过一个文本链接到达;
2)重要的页面应该能从网站较浅的层次目录中找到;
3)合理分类网站上的内容,不要过度细分;
(3)网站导航
1)为每个页面添加导航栏,方便用户和搜索引擎;
2)内容较多的网站建议使用面包屑式导航,方便定为网页位置
3)导航中使用文字链接,而不实用js;
4)使用图片做导航,可以使用alt标签让搜索引擎知道网页指向什么内容;
(4)子域名和目录选择
选择子域名还是目录来分配网站内容,对搜索引擎影响很大
1) 出身很重要
2) 内容差异大,关联度不高的使用子站点
3) 不要滥用子域名
(5)规范简单的url
创建具有良好描述性、规范、简单的url,有利于用户更方便的记忆和判断网页内容,有利于搜索引擎更有效的抓取网站。
1) 网站中同一网页只对应一种url
2) 让用户从url判断出网页内容和网站目录,即将要显示信息;
3) url尽量短
4) 正常的动态url对搜索引擎没有影响
5)不添加不能被系统自动识别的字符串为url
(5)良好排序
1)涵盖网页上主要内容的title标签
首页:网站名称或网站名称_提供服务介绍or产品介绍
频道页:频道名称_网站名称
文章也:文章名称_频道名称_网站名称
2)良好的内容建设
网站内容建设以服务网站核心价值为主,提供给搜索引擎的也应该是对自己核心价值有帮助的内容;
网站内容应该是面向用户的,搜索引擎只是网站的一个普通用户,提供用户需要的原创的内容是重要的;
写好锚文本,锚文本只链接时候的描述文字,指向链接的主题;
为图片标注alt
资源丰富的内容可以以专题形式来展示
Web2.0网站应该充分发挥自己的优势,让用户通过投票,评论判断自己的网站,这对搜索引擎也有利;
4)赢得用户的推荐当网站内容相同时,运用推荐,也就是链接;
5)meta标签
meta标签不是权值计算的参考因素,存在与否不影响网页权重,只作为搜索结果的一个参考目标主页、频道页、参数页没有大段摘要的准确的描述网页,不要堆砌关键字为每隔网页创建不同的description,长短合理,不要过短四、网站运营
1) 目标=转化率提高搜索引擎获取流量的最终目的是提高网站核心价值,有多少流量能转化为核心价值,就是转化率。
2) 流量分析跳出率:只看一眼便离开退出率:某个页面离开占浏览量得比重用户停留时间
3) 网站信任度用户给予网站的信任程度
(1) 页面美观整洁,有自己的风格;
(2) 详细的网站介绍,联系方式,让用户可以方便的联系到你;
(3) 用户品论,顾客反馈,让原有用户影响新用户;
(4) 强化网站品牌
4) 不断强化品牌概念互联网上的品牌建设是
以是以优质内容和服务换来的,从搜索引擎变为忠实用户;
1) 让用户知道他获取的内容来至你的网站;
2) 让用户再次通过信息找到你的网站
3) 让用户找到同类内容想到你的网站。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)