WebCache web的缓存机制_服务器知识

1.webcache的简单介绍

web缓存,是一种缓存技术 ,用于临时存储(缓存)的网页文件,如HTML页面和图像等静态资源,减少带宽以及后端服务器的压力,通常一个WebCache也是一个反向代理软件 ,既可以通过缓存响应用户的请求,当本地没有缓存时,可以代理用户请求至后端主机。

WebCache分为正向和反向之分，一般正向WebCache不常用,这次主要以反向WebCache为主。

2.webcache的由来

1)由于程序具有局部性,而局部性分为：时间局部性和空间局部性

A.时间局部性是指：在单位时间内,大部分用户访问的数据只是热点数据(热点数据指经常被访问的数据)

B.空间局部性是指：某新闻网站突然出来一个重大新闻,此新闻会被被反复访问。

3.webcache的变化性

WebCache的新鲜度监测机制：数据都是可变的,所以缓存中的内容要做新鲜度检测.

4.缓存相关的HTTP首部:

HTTP协议提供了多个首部用以实现页面缓存及缓存失效的相关功能，这其中最常用的有：

1)Expires：HTTP/1.0,用于指定某web对象的过期日期/时间，通常为GMT格式；一般不应该将此设定过长的时间，一年的长度对大多场景来说足矣；其常用于为纯静态内容如JavaScripts样式表或图片指定缓存周期；

(2)Cache-Control：为了解决HTTP/1.0中对于新鲜度控制的策略而生,通过相对时间来控制缓存使用期限；

(3)Etag：响应首部，用于在响应报文中为某web资源定义版本标识符；

(4)Last-Mofified：响应首部，用于回应客户端关于Last-Modified-Since或If-None-Match首部的请求，以通知客户端其请求的web对象最近的修改时间；

(5)If-Modified-Since：条件式请求首部，基于请求内容的时间戳作验正 ,如果后端服务器数据的时间戳未发生改变则继续使用,反之亦然.

(6)If-None-Match：条件式请求首部；通过Etag来跟后端服务器进行匹配，如果数据的Etag未发生改变,既不匹配,则响应新数据,否则继续使用当前数据.

(7)Vary：响应首部，原始服务器根据请求来源的不同响应的可能会有所不同的首部，最常用的是 Vary: Accept-Encoding，用于通知缓存机制其内容看起来可能不同于用户请求时 Accept-Encoding-header首部标识的编码格式；

(8)Age：缓存服务器可以发送的一个额外的响应首部，用于指定响应的有效期限；浏览器通常根据此首部决定内容的缓存时长；如果响应报文首部还使用了max-age指令，那么缓存的有效时长为 “max-age减去Age”的结果；

适合缓存的内容

1. 不变的图像，如logo，图标等

2. js、css静态文件

3. 可下载的内容，媒体文件

适合协商缓存

1. HTML文件

2. 经常替换的图片

3. 经常修改的js、css文件，js、css文件的加载可以加入文件的签名来拒绝缓存，如‘index.css?签名’，‘index.签名.js’

不建议缓存的内容

1. 用户隐私等敏感数据

2. 经常改变的API数据接口

NGINX配置缓存策略

本地缓存配置

1. add_header指令：添加状态码为2XX和3XX的响应头信息，设置代码add_header name value [always]，可以设置Pragma、Expires、Cache-Control，可以继承

2. expires指令：通知浏览器过期时长，设置代码expires time

3. Etag指令：指定签名，设置代码etag on|off，默认on

前端代码和资源压缩

优势

1. 让资源文件更小，加快文件在网络中的传输，让网页更快的展现，降低带宽和流量的开销

压缩方式

1. js、css、图片、html代码的压缩

2. gzip压缩

gzip配置

gzip on|off#是否开启gzipgzip_buffers 32 4K|16 8K#缓冲（在内存中缓存几块？每块多大）gzip_comp_level [1-9] #推荐6，压缩级别（级别越高，压得越小，越浪费CPU计算资源）

gzip_disable #正则匹配UA，什么样的Uri不进行gzip

gzip_min_length 200 #开始压缩的最小长度

gzip_http_version 1.0|1.1 #开始压缩的http协议版本

gzip_proxied #设置请求者代理服务器，该如何缓存内容

gzip_types text/plain application/xml image/png #对哪些类型的文件压缩，如txt、xml、css

gzip_vary on|off #是否传输gzip压缩标志

CDN加速

定义

1. CDN的全称content delivery network，内容分发网络

2. 尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节，使内容传输的更快、更稳定

3. 在网络各处放置节点服务器所构成的有的互联网基础之上的一层智能虚拟网络

4. CDN系统能够实现地根据网络流量和各节点的连接、负载状况以及到用户距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上

优势

1. 本地cache加速，提高了企业站点（尤其含有大量图片和静态页面站点）的访问速度

2. 跨运营商的网络加速，保证不同网络的用户都能得到良好的访问质量

3. 远程访问用户根据DNS负载均衡技术只能选择cache服务器

4. 自动生成服务器的远程Mirror（镜像）cache服务器，远程用户访问时从cache服务器上读取数据，减少远程访问的带宽、分担网络流量、减轻原站点web服务器负载等功能

5. 广泛分布的cdn节点加上节点之间的智能冗余机制，可以有效地预防黑客入侵

工作原理

1. 用户发起请求

2. 智能DNS的解析（根据IP判断地理位置、接入网类型、选择路由最短和负载最轻的服务器）

3. 取得缓存服务器ip

4. 把内容返回给用户（如果缓存中有，没有就执行5、6、7）

5. 向源站发起请求

6. 将结果返回给用户

7. 将结果存入缓存服务器

适用场景

1. 站点或者应用中大量静态资源的加速分发，例如css、js、图片和HTML

2. 大文件下载

3. 直播网站

独立图片服务器

必要性

1. 分担web服务器的I/O负载，将耗费资源的图片服务器分离出来，提高服务器的性能和稳定性

2. 能够专门对图片服务器进行优化，为图片服务器设置针对性的缓存方案，减少带宽成本，提高访问速度

3. 提高网站的可扩展性，通过增加图片服务器，提高图片吞吐能力

采用独立域名

原因：

1. 同一域名下浏览器的并发连接数有限制，突破浏览器连接数的限制

2. 由于cookie的原因，对缓存不利，大部分web cache都只缓存不带cookie的请求，导致每次的图片请求都不能命中cache

如何图片上传和同步

1. NFS共享方式

2. 利用FTP同步

动态语言静态化

将现有的PHP等动态语言的逻辑代码生成为静态的HTML文件，用户访问动态脚本重定向到静态HTML文件的过程。对实时性要求不高

原因：

1. 动态脚本通过会做逻辑计算和数据查询，访问量越大，服务器压力越大

2. 访问量大时可能会造成CPU负载过高，数据库服务器压力过大

3. 静态化可以减低逻辑处理压力，降低数据库服务器查询压力

实现方法

1. 使用模板引擎

2. 利用ob系列函数

需要获取swoole、workerman、TP、laravel、vue、Linux、redis以及性能优化，并发项目实战，微服务架构方面的资料，可以私信我哦

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/294568.html

WebCache web的缓存机制

发表评论

评论列表（0条）