昆明电脑培训分享web服务器缓存基本定义_服务器知识

为了能够给用户一个良好的上网体验，大部分的网页和浏览器都配置了预加载以及缓存功能。今天昆明电脑培训http://www.kmbdqn.com/就通过案例分析来了解一下，关于web缓存的基本定义与类型介绍。

Web缓存是什么?为什么要使用缓存?

Web缓存处于服务器(也称为源服务器)和客户端之间，监视请求并保存响应的副本，比如HTML页面，图片和文件等(统称为表述)。如果之后有对同一个URL的新请求，它会使用自己保存的内容来响应，而不是再次请求源服务器来获取内容。

使用Web缓存主要有下面两个原因：

减少延迟——因为响应请求的内容来自缓存(距客户端较近)而不是源服务器，它会花较少的时间来获得表述并将他们呈现出来。这使得Web看起来具有良好的响应速度。

减少网络传输——由于复用了表述，它可以减少客户端使用的带宽总量。如果客户需要为流量付费，这就意味着省钱。缓存会降低对带宽的要求，也降低处理难度。

Web缓存的种类

浏览器缓存

你在查看现代Web浏览器(比如IE、Safari或Mazilla)选项的时候，可能会看到“缓存”设置。这个选项让你配置一部分硬盘空间来保存你看过的表述。浏览器缓存的规则相当简单。它通常会在一次会话(即当前浏览器中一次调用)中检查表述是否新。

这个缓存在用户使用“回退”按钮或者点击一个浏览过的链接时会特别有用。而且，如果你在网站的各个页面中浏览相同的图片，他们几乎能马上从缓存中加载出来。

代理缓存

Web代理缓存的工作原理相同，但规模更大。代理以同样的方式为成百上千的用户服务大公司和ISP常常把代码缓存建立在防火墙之上，也可能是以独立设备的形式存在(也称为中间设备)。

代理缓存即不是客户端的一部分，也不是服务器的一部分，而是在网络之外，必须以某种方式把请求路由过去。其中一种方式是手工修改浏览器代理设备，指定要使用的代码另一种方式是拦截。拦截式代理会根据其自身的基础网络重定向Web请求，不需要在客户端配置，客户端甚至不知道它们的存在。

代理缓存是一种共享缓存，通常不只是一个用户，而是大量用户在使用代理缓存。正因为如此，他们特别擅长降低延迟和网络传输量。这是因为众人都需要的表述会被多次重复使用。

网关缓存

网关缓存又名“反向代理缓存”或“替代缓存”。网关缓存也是一种中介，它他们不是由网络管理员部署以节约带宽，而是由网站管理员自己部署，使其站点更具伸缩性、可靠性以及拥有更好的性能。

很多方法都可以把请求路由到网关缓存，但常见的方法是使用负载均衡器让他们对于客户来说，看起来就跟源服务器一样。

内容分发网络(CDN)在整个Internet(或它的一部分)中分发网关缓存，并将其出售给对此感兴趣的网站。

Web缓存对我有坏处么?我为什么要帮助它们?

Web缓存是互联网中误解深的技术之一。因为代理缓存可以隐藏使用网站的用户，所以网站管理员特别害怕失去对他们的站点的控制，这会使得他们很难去知道是谁在使用他们的站点。

然而不幸的是，即使没有Web缓存，网络上也有非常多的因素可以保证管理员精确的知道一个用户如何使用他们的站点。如果这是你非常关注的问题的话，这篇手册将会指导你如何在站点没有不友好的缓存机制的情况下获取你需要的统计信息。

一、浏览器缓存

浏览器缓存即http缓存；浏览器缓存根据是否需要向服务器重新发起HTTP请求将缓存过程分为两个部分，分别是强制缓存和协商缓存。

浏览器第一次请求资源的时候服务器会告诉客户端是否应该缓存资源，根据响应报文中HTTP头的缓存标识，决定是否缓存结果，是则将请求结果和缓存标识存入浏览器缓存中。如下图：

1.强制缓存：浏览器会对缓存进行查找，并根据一定的规则确定是否使用缓存。

强制缓存的缓存规则？

HTTP/1.0 Expires 这个字段是绝对时间，比如2018年6月30日12:30，然后在这个时间点之前的请求都会使用浏览器缓存，除非清除了缓存。

这个字段的缺点就是只会同步客户端的时间，这就有可能修改客户端时间导致缓存失效。

HTTP/1.1 cache-Control 这个是1.1的时候替换Expires的，它会有几种取值：

public ：所有内容都将被缓存（客户端和代理服务器都可缓存）

private ：所有内容只有客户端可以缓存， Cache-Control的默认取值

no-cache ：客户端缓存内容，但是是否使用缓存则需要经过协商缓存来验证决定

no-store ：所有内容都不会被缓存，即不使用强制缓存，也不使用协商缓存

max-age=xxx (xxx is numeric) ：缓存内容将在xxx秒后失效

比如max-age=500，则在500秒内再次请求会直接只用缓存。

优先性：cache-Control >Expires

如果同时存在，cache-Control会覆盖Expires。

这个字段的缺点就是：

如果资源更新的速度是秒以下单位，那么该缓存是不能被使用的，因为它的时间单位最低是秒。

如果文件是通过服务器动态生成的，那么该方法的更新时间永远是生成的时间，尽管文件可能没有变化，所以起不到缓存的作用。

上图中浏览器缓存中存在该资源的缓存结果，并且没有失效，就会直接使用缓存的内容。

上图中浏览器缓存中没有该资源的缓存结果和标识，就会直接向服务器发起HTTP请求。

2.协商缓存：浏览器的强制缓存失效后(时间过期)，浏览器携带缓存标识请求服务器，由服务器决定是否使用缓存。

服务器决定的规则？

控制协商缓存的字段有 Last-Modified / If-Modified-Since 和 Etag / If-None-Match。

①Last-Modified 是服务器返回给浏览器的本资源的最后修改时间。

当下次再次请求的时候，浏览器会在请求头中带 If-Modified-Since ,即上次请求下来的 Last-Modified 的值，

然后服务器会用这个值和该资源最后修改的时间比较，如果最后修改时间大于这个值，则会重新请求该资源，返回状态码200。

如果这个值和最后修改时间相等，则会返回304，告诉浏览器继续使用缓存。

② Etag 是服务器返回的一个hash值。

当下次再次请求的时候，浏览器会在请求头中带 If-None-Match ,即上次请求下来的 Etag 值，

然后服务器会用这个值和该资源在服务器的 Etag 值比较，如果一致则会返回304，继续使用缓存；如果不一致，则会重新请求，返回200。

二、服务器缓存

上面是一个简单的流程图：

用户1访问A页面，服务器解析A页面返回给用户1，同时在服务器内存上做一定映射，把A页面缓存在硬盘上面

用户2访问A页面，服务器直接根据内存上的映射找到对应的页面缓存，直接返回给用户2，这样就减少了服务器对同一页面的重复解析

服务器缓存和浏览器缓存的区别：

服务器缓存是把页面缓存到服务器上的硬盘里，而浏览器缓存是把页面缓存到用户自己的电脑里

Nginx服务器

Nginx是一个高性能的HTTP和反向代理服务器。具有非常多的优越性：

在连接高并发的情况下，Nginx是Apache服务器不错的替代品，Nginx在美国是做虚拟主机生意的老板们经常选择的软件平台之一。

Nginx提供了expires、etag、if-modified-since指令来实现浏览器缓存控制。

nginx -s reload#重新加载配置文件

nginx -s reopen#重新打开log文件

nginx -s stop#快速关闭nginx服务

nginx -s quit #优雅的关闭nginx服务，等待工作进程处理完所有的请求

Nginx设置静态文件的缓存过期时间

location ~.*\.(js|css|html|png|jpg)$ {

expires 3d

}

expires 3d//表示缓存3天

expires 3h//表示缓存3小时

expires max//表示缓存10年

expires -1//表示永远过期。

如果设置为-1在js、css等静态文件在没有修改的情况下返回的是http 304，如果修改返回http 200

对于静态资源会自动添加ETag，可以通过添加etag off指令禁止生成ETag。如果是静态文件，那么Last-Modified值为文件的最后修改时间。

在开发调试web的时候，经常会碰到因浏览器缓存(cache)而经常要去清空缓存或者强制刷新来测试的烦恼，提供下apache不缓存配置和nginx不缓存配置的设置。在常用的缓存设置里面有两种方式，都是使用add_header来设置：分别为Cache-Control和Pragma。

location ~ .*\.(css|js|swf|php|htm|html )$ {

add_header Cache-Control no-store

add_header Pragma no-cache

}

nginx gzip压缩

使用 gzip 压缩可以降低网站带宽消耗，同时提升访问速度。

主要在nginx服务端将页面进行压缩，然后在浏览器端进行解压和解析，

目前大多数流行的浏览器都迟滞gzip格式的压缩，所以不用担心。

默认情况下，Nginx的gzip压缩是关闭的，同时，Nginx默认只对text/html进行压缩

gzip on

ersio #开启gzip压缩输出

gzip_http_vn 1.0 #默认1.1

#其中的gzip_http_version的设置，它的默认值是1.1，就是说对HTTP/1.1协议的请求才会进行gzip压缩

#如果我们使用了proxy_pass进行反向代理，那么nginx和后端的upstream server之间是用HTTP/1.0协议通信的。

gzip_vary on

#和http头有关系，加个vary头，给代理服务器用的，有的浏览器支持压缩，有的不支持，

#所以避免浪费不支持的也压缩，所以根据客户端的HTTP头来判断，是否需要压缩

gzip_comp_level 6

#设置gzip压缩等级，等级越底压缩速度越快文件压缩比越小，反之速度越慢文件压缩比越大 1-9

gzip_proxied any

#Ngnix作为反向代理的时候启用

#expample:gzip_proxied no-cache

# off – 关闭所有的代理结果数据压缩

# expired – 启用压缩，如果header中包含”Expires”头信息

# no-cache – 启用压缩，如果header中包含”Cache-Control:no-cache”头信息

# no-store – 启用压缩，如果header中包含”Cache-Control:no-store”头信息

# private – 启用压缩，如果header中包含”Cache-Control:private”头信息

# no_last_modified – 启用压缩，如果header中包含”Last_Modified”头信息

# no_etag – 启用压缩，如果header中包含“ETag”头信息

# auth – 启用压缩，如果header中包含“Authorization”头信息

# any – 无条件压缩所有结果数据

gzip_types text/html #压缩的文件类型

#设置需要压缩的MIME类型,非设置值不进行压缩

#param:text/html|application/x-javascript|text/css|application/xml

gzip_buffers 16 8k#设置gzip申请内存的大小,其作用是按块大小的倍数申请内存空间设置gzip申请内存的大小,其作用是按块大小的倍数申请内存空间

#设置gzip申请内存的大小,其作用是按块大小的倍数申请内存空间

# param1:int 增加的倍数

# param2:int(k) 后面单位是k

# example: gzip_buffers 4 8k

# Disable gzip for certain browsers.

gzip_disable “MSIE [1-6].(?!.*SV1)”#ie6不支持gzip，需要禁用掉ie6

这是两种主要的Web缓存：

直接缓存，将用户频繁访问的来自Internet服务器的Web对象的拷贝保存在企业本地网络中。

反向缓存，企业内部Web服务器的Web对象的拷贝保存在企业网络边缘的代理服务器上以提高外界访问企业站点的性能。

Web缓存可以根据不同等级进行配置：

本地缓存：将Web对象缓存的拷贝保存在本地计算机中。大多数流行的Web浏览器默认情况下保留一个先前访问对象的缓存。例如，Internet Explorer称之为“临时Internet文件”。本地缓存拷贝只是在用户频繁地从同一台机器访问页面时有用。

代理缓存：代理服务器是为公司内的多个用户/客户计算机缓存Web对象的单独机器。它们是位于客户端和托管的Web服务器之间的计算机，而且它们比本地缓存效率更高，因为在企业本地网络中的任何用户或计算机访问某个Web对象时，缓存拷贝对想访问该对象的任何其他用户/计算机是可用的，无需到Internet服务器上再次下载它。代理缓存可以在网络边缘与防火墙结合使用。

微软的ISA Server和BlueCoat的工具一样，既包括防火墙也包括缓存代理服务器。缓存服务器也可以是单独的机器，运行免费的缓存软件或商业产品，例如：

Linux版的Squid免费缓存代理

MOWS基于Java分布式web和缓存服务器

Vicomsoft RapidCache Server for Windows或Macintosh

WinProxy for Windows

可升级的缓存解决方案

随着公司的扩大，单一的Web缓存服务器可能无法处理所有的通信或存储足够的Web对象。在这种情况下，可以扩展缓存解决方案以建立一个缓存阵列——一组共同工作以便在组内分配缓存负载的缓存代理服务器。万一某个缓存服务器停机，还提供缺省的容量。

要在阵列中操作，缓存服务器必须能够彼此使用协议进行通信，例如：

WCCP（Web缓存协调协议），Cisco缓存产品以及诸如Squid这样的开源代理使用。

ICP（Internet缓存协议），被Squid和BlueCoat支持。

CARP（缓存阵列路由协议），被ISA Server Enterprise Edition用来管理缓存服务器阵列的失效转移和负载平衡。

CARP能够支持几乎无限的线性扩展以满足快速增长型企业的需求。当向某个阵列中添加或移除一台服务器时，CARP自动调整并再指定URL以有效地分布负载。

缓存阵列能够以等级的或分布式的架构排列。在分布式缓存中，阵列中所有代理服务器处在一个“平等地位”而且负载在它们之间进行分配。在分等级的缓存中，代理以链式进行配置，它们处在不同的等级，所以服务器或阵列连接到其它离Internet更近的服务器或阵列（离Internet最近的那些服务器或阵列被看作“上游的”，那些最远的被看作“下游的”）。这样，缓存内容会尽可能地靠近需要它的用户。

阵列是高度可升级的，因为可以向阵列添加服务器，或向分等级的架构增加阵列等级，而无需扰乱目前的缓存解决方案。

另一个可扩展性问题是使用缓存减少分支机构网络带宽的能力。分支机构代理可能没有直接连接到Internet，但是可以使用拨号连接或办公室到办公室的WAN连接以便从总公司的上游代理服务器上请求Web对象。

另一个选择是为需要向消费者提供基于Web的应用，可使用诸如由Akamai提供的服务。他们的Web Application Accelerator服务通过下列方法优化性能：

向他们的边缘服务器动态映射请求，并监视Internet路由以便在最快和最可靠的路由上传输。

利用压缩技术和预取技术（pre-fetching）以最小化带宽使用率。

用安全套接层（SSL）保护Web传输。

缓存支持的有些硬件标准：

目前缓存支持的硬件标准：

内存不超过4G，超过的只识别4G。

硬盘不超过2T，超过的只识别2T

存储硬盘数量最大支持4块（如果系统盘是电子盘不包含在内）

另外推荐使用INTEL的机器和网卡。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/227133.html

昆明电脑培训分享web服务器缓存基本定义

发表评论

评论列表（0条）