CDN的工作原理和过程

CDN的工作原理和过程,第1张

CDN一种比较重要的优化手段就是和DNS结合,让用户访问延迟最小的节点

一种比较简单的方法是基于地理位置的routing,即,对于DNS请求总是返回距离请求者最近的节点。实现方法很多,不过最终都依赖于一个CIDER到地理位置的表。

这里的地理位置,可以是经纬度,也可以是就近城市的代号。

DNS服务器,接收到请求之后,会根据用户IP找到最匹配的一项,并且计算距离这个用户最近的Edge服务器,将这个最优点的IP返回给用户。

这种方法并不是最优的。因为地理位置上最近的两个点,延迟可能反而很高。比如欧洲某些国家到美国东海岸的延时可能相当小。

或者某个网络服务提供商内部延迟比较小,北美自己的教育网内部延迟比较小,等等。

还有就是根据用户AS号码和AS之间的样本延迟来估计延迟的。这种做法比较复杂:比如,我有很多分布在世界各地的主机,这些主机之间可以周期性的计算延迟,这样就能动态的获得AS-AS之间的延迟。由于网络的特殊性质,这种方法比起前一种要准确得多。

DNS是用户请求的第一步,所以针对DNS查询结果的优化是一个很重要的课题。

DNS对于CDN还有其他功用,比如负载均衡(load balancing)(使用RR或者WRR)和DNS failover。我不是很熟悉,就不多说了。

CDN是一种重要的优化方法,它与DNS相结合,使用户能够以最小的延迟访问节点。

一个更简单的方法是基于地理路由,也就是说,对于DNS请求,总是返回到请求者最近的节点。实现方法有很多,不过最终都依赖于一个CIDER到地理位置的表。

这里的地理位置可以是纬度和经度,也可以是附近城市的代号。

DNS服务器在收到请求后,根据用户的IP找到最匹配的项目,并计算出离用户最近的边缘服务器,并将最佳IP返回给用户。

这种方法不是最佳的。由于地理位置上的两个最近点,延迟可能非常大。例如,从一些欧洲国家到美国东海岸的延误可能很小。

或者网络服务提供商的内部延迟相对较小,北美自身教育网络的内部延迟相对较小,等等。

另一种方法是根据用户as number和as之间的样本延迟来估计延迟。这种方法更复杂:例如,我在世界各地分布了许多主机,它们可以定期计算这些主机之间的延迟,以便动态地获得as-as之间的延迟。由于网络的特殊性,该方法比以前的方法更准确。

DNS是用户请求的第一步,因此DNS查询结果的优化是一个非常重要的课题。

DNS还具有用于CDN的其他功能,例如负载平衡(使用rr或wrr)和DNS故障转移。我不太熟悉,我们不要说太多。

CDN使用了DNS的CNAME、edns-client-subnet和负载均衡等技术。

1.CNAME

在用户访问某网页、视频等资源时,会将域名指向另一个CDN中定义的域名,再解析成另一个IP地址来供客户端进行访问,使客户端访问时进行加速。

2.edns-client-subnet

智能DNS解析是CDN重要的组成部分,是根据请求用户对同一域名作出相应不同的解析,因此CDN的调度准确性是依靠DNS智能解析的。

一、什么是CDN?

CDN的全称是Content Delivery Network,翻译成中文就是内容分发网络。CDN依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取内容,降低网络延迟,提高访问速度。简单来讲,CDN是用来进行加速的,它可以让用户更快获得所需的数据。

举个例子,某个网站的服务器在北京,如果深圳的用户想要获取服务器上的数据,就需要跨越很远的距离,由于传输速度和路由转发等因素,就会导致访问速度非常缓慢。但如果我们在深圳建立一个CDN服务器,上面缓存了一些服务器数据,那么深圳用户只需要访问这个CND的服务器就能获取相关的内容,这样速度就提升了很多。

二、什么是DNS?

要了解cdn就先要了解一下dns。当我们在浏览器中输入一个域名时,就能访问对应的站点。但实际的情况远比我们看到的复杂,因为计算机不能直接识别域名,所以必须依靠某种环节将域名翻译成IP地址才能,这个环节就是DNS。

当我们向DNS服务器发起解析域名的请求时,DNS服务器首先会查询自己的缓存中有没有该域名,如果缓存中存在该域名,则可以直接返回IP地址。如果缓存中没有,服务器则会以递归的方式层层访问。

例如,我们要访问www.baidu.com,首先我们会先向全球13个根服务器发起请求,询问com域名的地址,然后再向负责com域名的名称服务器发送请求,找到baidu.com,这样层层递归,最终找到我们需要的IP地址。

三、CDN和DNS的区别

上面我们提到CDN实际上提供就是一个就近访问的功能,但现在有一个问题是,我们如何直到用户所在的位置并为其分配最佳的CDN节点呢。这就需要用DNS服务进行定位了。

当我们使用DNS服务时,可以根据用户使用的递归服务器进行定位。但你给我们看到用户使用的是深圳的递归服务器,那么就认为该用户来自深圳,然后调度服务器就让该客户去访问深圳的CDN服务器。

但这种调度方式可能存在一个问题,就是用户的实际IP与递归服务器并不一致。比如我是北京联通的用户却使用了深圳电信的递归服务器,那么调度服务器为我分配深圳电信的CDN服务器,就会产生错误的调度。

四、HTTP调度

针对上面的问题,我们还有另一种调度方式——http调度。

当用户访问服务器时,先分析用户的IP地址,然后服务器给用户返回一个302重定向,将离用户最近的服务器存在缓存中,用户再去请求时就能得到最佳的CDN节点。

这种方式定位更加准确,但缺点是需要增加一次额外的HTTP访问,这样导致首次访问的延时比较高。

所以在实际情况中,我们可以将两种方式结合起来,先通过dns的方式来定位,然后通过http的方式来纠正偏差。

五、缓存的两种方式

CDN节点中缓存了服务器上的部分资源。那么服务器怎么去更新CDN节点的缓存呢?

一种方式,是服务器主动进行缓存的更新,CDN节点被动接受。另一种方式是用户请求的资源不存在时,CDN节点主动放弃请求,更新缓存,然后将数据返给用户。

显然第一种方式存在很多问题,例如很容易产生404等,所以一般采用第二种缓存方式。

六、CDN工作流程

当用户请求一个文件时,CDN的工作过程如下:

1.DNS请求当地local DNS

2.当地local DNS递归地查询服务器的gslb

3.服务器根据local DNS 分配最佳节点,返回IP

4.用户获得最佳接入IP,访问最佳节点。

5.如果该节点没有用户想要获取的内容,则通过内部路由访问上一节点,直到找到文件或到达源站为止。

6.CDN节点缓存该数据,下次请求该文件时可以直接返回。

CDN的全称Content Delivery Network,(缩写:CDN)即内容分发网络。CDN是个经策略性部署的整体系统,从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均而产生的用户访问网站响应速度慢的根本原因。CDN目的是通过在现有的Internet中增加层新的网络架构,将网站的内容发布到接近用户的网络“边缘”,使用户可以就近取得所需的内容,解决Internet网络拥塞状况,提高用户访问网站的响应速度。

CDN加速的原理是什么?CDN加速技术就是在用户和服务器之间增加镜像缓存(Cache)层,将用户的访问请求引导到镜像缓存(Cache)节点而不是服务器源站点,要实现这目的,主要是通过接管DNS实现,下面图示便可看出传统网站访问过程与使用CDN加速技术后的网站访问过程之间的区别所在。

流程看图

在CDN加速过程中,全局负载均衡DNS解析服务器会根据用户端的源IP地址,如地理位置(山东还是香港)、接入网类型(联通还是网通)将用户的访问请求定位到离用户路由短、位置近、负载轻的Cache节点(缓存服务器)上,实现就近定位。定位优先原则可按位置、可按路由、也可按负载等。

也就是说CDN加速技术的原理很简单就是在传统网站访问过程中生成N多个原网站镜像,并分别储存在不同的地区,不同线路的缓存服务器上,并在用户访问网站时做出定的就近、负载轻,利于用户快访问网站路线判断,然后做出响应,这样就在用户地区、网络线路多样性的情况下,保证所有地区及网络线路都以同样的快的速度访问网站。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/89389.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-06
下一篇2023-03-06

发表评论

登录后才能评论

评论列表(0条)

    保存