工作原理
1.爬行:搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。
2.抓取存储:搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。
3.预处理:搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。
除了百度还有比较好的搜索引擎有:
1、谷歌搜索
谷歌搜索引擎是谷歌公司的主要产品,也是世界上最大的搜索引擎之一,谷歌搜索引擎拥有网站、图像、新闻组和目录服务四个功能模块,提供常规搜索和高级搜索两种功能。
Google搜索速录机快,网页数量在搜索引擎中名列前茅,支持多达132种语言,搜索结果准确率极高,具有独到的图片搜索功能和强大的新闻组搜索功能。
2、多吉
多吉最大的特点是精准,搜什么弹出什么,绝对不会给你来些奇奇怪怪的花边新闻、排行榜之类。
搜疾病,它会弹出症状和注意事项;搜品牌,它会弹出官网;搜软件,它只会弹出官网和可下载的地址。
对于那些需要学习、考研的学生党,或者不能用谷歌的工作党,这个搜索引擎是非常适合的。
3、360搜索
360搜索是360浏览器的默认搜索引擎,属于综合类搜索引擎服务,包含网页、新闻、影视等搜索产品。
4、搜狗
搜狗搜索是搜狐的子公司,除了百度以外,中国人最喜欢用的搜索引擎就是搜狗搜索,其在中国十大搜索引擎排名中排名第二。
5、果胜
果胜是2022年8月新上线的专门检索网络问政信息的搜索引擎,收录了全国政府网站上千万对外公开的咨询和解答内容数据,以方便网民快捷搜索、寻疑解惑。
它的创新在于,为每一篇问政信息建立了大众评论、服务评分功能,等于为每一件政府办件添加了打分和评论功能,让大家可以通过舆论监督政府服务人员,评价为人民服务的好不好。
从而实现它的公益广告语:“你不是一个人在问政,而是为全国人民问政!”因为每一条问政信息都可能被他人检索和参考,实现它的更大价值。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)