主要功能
1)设置用户验证和记账功能,可按用户进行记账,没有登记的用户无权通过代理服务器访问Internet网。并对用户的访问时间、访问地点、信息流量进行统计。2)对用户进行分级管理,设置不同用户的访问权限,对外界或内部的Internet地址进行过滤,设置不同的访问权限。
3)增加缓冲器(Cache),提高访问速度,对经常访问的地址创建缓冲区,大大提高热门站点的访问效率。通常代理服务器都设置一个较大的硬盘缓冲区(可能高达几个GB或更大),当有外界的信息通过时,同时也将其保存到缓冲区中,当其他用户再访问相同的信息时,则直接由缓冲区中取出信息,传给用户,以提高访问速度。
(4)连接内网与Internet,充当防火墙(Firewall):因为所有内部网的用户通过代理服务器访问外界时,只映射为一个IP地址,所以外界不能直接访问到内部网;同时可以设置IP地址过滤,限制内部网对外部的访问权限。
(5)节省IP开销:代理服务器允许使用大量的伪IP地址,节约网上资源,即用代理服务器可以减少对IP地址的需求,对于使用局域网方式接入Internet ,如果为局域网(LAN)内的每一个用户都申请一个IP地址,其费用可想而知。但使用代理服务器后,只需代理服务器上有一个合法的IP地址,LAN内其他用户可以使用10.*.*.*这样的私有IP地址,这样可以节约大量的IP,降低网络的维护成本。
我们可以将巨大的互联网比作成一张网络蜘蛛网,而网络爬虫便是在蜘蛛网上爬行的蜘蛛,把网的节点描述成为网页,我们将每日任务需求借助客户端电脑发出命令,而ip便是被执行的角色,ip带着每日任务借助因特网抵达终端服务器寻找客户端交代的每日任务,一个一个节点便是一个一个网页,如此蜘蛛借助一个节点之后,就可以沿着几点连线继续爬行抵达下个节点。也就说借助一个网页继续抓取。
爬虫首要便是要抓取终端服务器的网页,也就是抓取到网页的源代码,源代码包中抓取到实用的信息,就将实用的源代码获取,提取每日任务中所需的信息。
ip将抓取到实用的信息回到到客户端存储,随后再返回去,不断频繁的访问获得信息直到完成任务。因此ip便是负责带着每日任务寻找有价值的信息,随后将抓取到的有价值的信息数据负责带回(传输)到客户端,直到完成任务。
http服务器和web服务器不是同一个服务器,联系:两者都是用来处理http请求,并根据http请求返回响应数据的服务器,区别如下:
一、指代不同
1、http服务器:是Apache软件基金会的一个开放源代码的网页服务器。
2、web服务器:也称为WWW(WORLD WIDE WEB)服务器,主要功能是提供网上信息浏览服务。
二、功能不同
1、http服务器:可以在大多数电脑操作系统中运行,由于其具有的跨平台性和安全性,被广泛使用。
2、web服务器:可以解析(handles)HTTP协议。当Web服务器接收到一个HTTP请求(request),会返回一个HTTP响应(response),例如送回一个HTML页面。
三、特点不同
1、http服务器:快速、可靠并且可通过简单的API扩展,Perl/Python解释器可被编译到服务器中,可以创建一个每天有数百万人访问的Web服务器。
2、web服务器:Web服务器传送(serves)页面使浏览器可以浏览,然而应用程序服务器提供的是客户端应用程序可以调用(call)的方法(methods)。
参考资料来源:百度百科-web server
参考资料来源:百度百科-Apache HTTP Server
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)