详解基于UDP的低延时网络传输层协议——QUIC_服务器知识

Quic 全称 quick udp internet connection [1]，“快速 UDP 互联网连接”，（和英文 quick 谐音，简称“快”）是由 Google 提出的使用 udp 进行多路并发传输的协议。

Quic 相比现在广泛应用的 http2+tcp+tls 协议有如下优势 [2]：

减少了 TCP 三次握手及 TLS 握手时间；

改进的拥塞控制；

避免队头阻塞的多路复用；

连接迁移；

前向冗余纠错。

从上个世纪 90 年代互联网开始兴起一直到现在，大部分的互联网流量传输只使用了几个网络协议。使用 IPv4 进行路由，使用 TCP 进行连接层面的流量控制，使用 SSL/TLS 协议实现传输安全，使用 DNS 进行域名解析，使用 HTTP 进行应用数据的传输。

而且近三十年来，这几个协议的发展都非常缓慢。TCP 主要是拥塞控制算法的改进，SSL/TLS 基本上停留在原地，几个小版本的改动主要是密码套件的升级，TLS1.3[3] 是一个飞跃式的变化，但截止到今天，还没有正式发布。IPv4 虽然有一个大的进步，实现了 IPv6，DNS 也增加了一个安全的 DNSSEC，但和 IPv6 一样，部署进度较慢。

随着移动互联网快速发展以及物联网的逐步兴起，网络交互的场景越来越丰富，网络传输的内容也越来越庞大，用户对网络传输效率和 WEB 响应速度的要求也越来越高。

一方面是历史悠久使用广泛的古老协议，另外一方面用户的使用场景对传输性能的要求又越来越高。

如下几个由来已久的问题和矛盾就变得越来越突出：

协议历史悠久导致中间设备僵化；

依赖于操作系统的实现导致协议本身僵化；

建立连接的握手延迟大；

队头阻塞。

可能是 TCP 协议使用得太久，也非常可靠。所以我们很多中间设备，包括防火墙、NAT 网关，整流器等出现了一些约定俗成的动作。

比如有些防火墙只允许通过 80 和 443，不放通其他端口。NAT 网关在转换网络地址时重写传输层的头部，有可能导致双方无法使用新的传输格式。整流器和中间代理有时候出于安全的需要，会删除一些它们不认识的选项字段。

TCP 协议本来是支持端口、选项及特性的增加和修改。但是由于 TCP 协议和知名端口及选项使用的历史太悠久，中间设备已经依赖于这些潜规则，所以对这些内容的修改很容易遭到中间环节的干扰而失败。

而这些干扰，也导致很多在 TCP 协议上的优化变得小心谨慎，步履维艰。

TCP 是由操作系统在内核西方栈层面实现的，应用程序只能使用，不能直接修改。虽然应用程序的更新迭代非常快速和简单。但是 TCP 的迭代却非常缓慢，原因就是操作系统升级很麻烦。

现在移动终端更加流行，但是移动端部分用户的操作系统升级依然可能滞后数年时间。PC 端的系统升级滞后得更加严重，windows xp 现在还有大量用户在使用，尽管它已经存在快 20 年。

服务端系统不依赖用户升级，但是由于操作系统升级涉及到底层软件和运行库的更新，所以也比较保守和缓慢。

这也就意味着即使 TCP 有比较好的特性更新，也很难快速推广。比如 TCP Fast Open。它虽然 2013 年就被提出了，但是 Windows 很多系统版本依然不支持它。即时通讯聊天软件开发可以咨询蔚可云。

不管是 HTTP1.0/1.1 还是 HTTPS，HTTP2，都使用了 TCP 进行传输。HTTPS 和 HTTP2 还需要使用 TLS 协议来进行安全传输。

这就出现了两个握手延迟：

1）TCP 三次握手导致的 TCP 连接建立的延迟；

2）TLS 完全握手需要至少 2 个 RTT 才能建立，简化握手需要 1 个 RTT 的握手延迟。

对于很多短连接场景，这样的握手延迟影响很大，且无法消除。

队头阻塞主要是 TCP 协议的可靠性机制引入的。TCP 使用序列号来标识数据的顺序，数据必须按照顺序处理，如果前面的数据丢失，后面的数据就算到达了也不会通知应用层来处理。

另外 TLS 协议层面也有一个队头阻塞，因为 TLS 协议都是按照 record 来处理数据的，如果一个 record 中丢失了数据，也会导致整个 record 无法正确处理。

概括来讲，TCP 和 TLS1.2 之前的协议存在着结构性的问题，如果继续在现有的 TCP、TLS 协议之上实现一个全新的应用层协议，依赖于操作系统、中间设备还有用户的支持。部署成本非常高，阻力非常大。

所以 QUIC 协议选择了 UDP，因为 UDP 本身没有连接的概念，不需要三次握手，优化了连接建立的握手延迟，同时在应用程序层面实现了 TCP 的可靠性，TLS 的安全性和 HTTP2 的并发性，只需要用户端和服务端的应用程序支持 QUIC 协议，完全避开了操作系统和中间设备的限制。

0RTT 建连可以说是 QUIC 相比 HTTP2 最大的性能优势。那什么是 0RTT 建连呢？

这里面有两层含义：

传输层 0RTT 就能建立连接；

加密层 0RTT 就能建立加密连接。

TCP 的拥塞控制实际上包含了四个算法：慢启动，拥塞避免，快速重传，快速恢复 [22]。

QUIC 协议当前默认使用了 TCP 协议的 Cubic 拥塞控制算法 [6]，同时也支持 CubicBytes, Reno, RenoBytes, BBR, PCC 等拥塞控制算法。

从拥塞算法本身来看，QUIC 只是按照 TCP 协议重新实现了一遍，那么 QUIC 协议到底改进在哪些方面呢？主要有如下几点。

【可插拔】：

什么叫可插拔呢？就是能够非常灵活地生效，变更和停止。体现在如下方面：

1）应用程序层面就能实现不同的拥塞控制算法，不需要操作系统，不需要内核支持。这是一个飞跃，因为传统的 TCP

拥塞控制，必须要端到端的网络协议栈支持，才能实现控制效果。而内核和操作系统的部署成本非常高，升级周期很长，这在产品快速迭代，网络爆炸式增长的今天，显然有点满足不了需求；

2）即使是单个应用程序的不同连接也能支持配置不同的拥塞控制。就算是一台服务器，接入的用户网络环境也千差万别，结合大数据及人工智能处理，我们能为各个用户提供不同的但又更加精准更加有效的拥塞控制。比如 BBR 适合，Cubic 适合；

3）应用程序不需要停机和升级就能实现拥塞控制的变更，我们在服务端只需要修改一下配置，reload 一下，完全不需要停止服务就能实现拥塞控制的切换。

STGW 在配置层面进行了优化，我们可以针对不同业务，不同网络制式，甚至不同的 RTT，使用不同的拥塞控制算法。

【单调递增的 Packet Number】：

TCP 为了保证可靠性，使用了基于字节序号的 Sequence Number 及 Ack 来确认消息的有序到达。

QUIC 同样是一个可靠的协议，它使用 Packet Number 代替了 TCP 的 sequence number，并且每个 Packet Number 都严格递增，也就是说就算 Packet N 丢失了，重传的 Packet N 的 Packet Number 已经不是 N，而是一个比 N 大的值。而 TCP 呢，重传 segment 的 sequence number 和原始的 segment 的 Sequence Number 保持不变，也正是由于这个特性，引入了 Tcp 重传的歧义问题。

QUIC 的流量控制 [22] 类似 HTTP2，即在 Connection 和 Stream 级别提供了两种流量控制。为什么需要两类流量控制呢？主要是因为 QUIC 支持多路复用。

Stream 可以认为就是一条 HTTP 请求。

Connection 可以类比一条 TCP 连接。多路复用意味着在一条 Connetion 上会同时存在多条 Stream。既需要对单个 Stream 进行控制，又需要针对所有 Stream 进行总体控制。

QUIC 实现流量控制的原理比较简单：

通过 window_update 帧告诉对端自己可以接收的字节数，这样发送方就不会发送超过这个数量的数据。

通过 BlockFrame 告诉对端由于流量控制被阻塞了，无法发送数据。

QUIC 的流量控制和 TCP 有点区别，TCP 为了保证可靠性，窗口左边沿向右滑动时的长度取决于已经确认的字节数。如果中间出现丢包，就算接收到了更大序号的 Segment，窗口也无法超过这个序列号。

但 QUIC 不同，就算此前有些 packet 没有接收到，它的滑动只取决于接收到的最大偏移字节数。

QUIC 的多路复用和 HTTP2 类似。在一条 QUIC 连接上可以并发发送多个 HTTP 请求 (stream)。但是 QUIC 的多路复用相比 HTTP2 有一个很大的优势。

QUIC 一个连接上的多个 stream 之间没有依赖。这样假如 stream2 丢了一个 udp packet，也只会影响 stream2 的处理。不会影响 stream2 之前及之后的 stream 的处理。

这也就在很大程度上缓解甚至消除了队头阻塞的影响。

先简单说一下很多时候是由于网站空间服务器的配置

或者资源限制导致的不足以承受运行的情况

有些是买的时候不知道有所限制而不能满足程序的运营需求

最好是联系服务商查阅相关日志对症下药如果撑不住最好换机器

-----------------------------------------

出现这种情况是由于您的网站超过了系统资源限制（CPU或者IIS）造成的，

这个现象在WINDOWS2003+IIS6的环境下都会出现，主要是程序占用资源太多。

不同的程序占用的资源都不一样，这个跟程序设计的合理性和优化程度有关；

另外，一些死循环程序，或者不优化的程序都会占用太多的系统资源，而系统资源明显是有限的。如果一个网站的程序占资源太多或者发生太多的错误，系统日志就会提示：“应用程序池 'User_pooll' 被自动禁用，原因是为此应用程序池提供服务的进程中出现一系列错误，或者提示：应用程序池 'User_pooll' 超过了其作业限制设置。

这时，访问这个网站就会提示：Service Unavailable。

一般系统会在30秒左右恢复正常，多刷新几次就能正常访问了。但是这个时间恢复后因为访问量太大在极短的时间网站又不能上了。

另外，如果网站当前访问人数过多，超过了系统的iis连接数(或CPU峰值）限制，也会出现Service Unavailable的提示(win2k主机下出现连接过多就会提示：连接过多，请稍后再试；而win2003的主机刚直接提示：Service Unavailable）如果经常出现类似的错误，请及时优化网站程序，或者升级你的主机至更高的款型，以获得更多的系统资源。

网站超CPU的四种可能原因：

一.网站攻击

二.程序设计不合理，资源占用高，或本身在做占资源的操作，如采集

三.访问量过大

四.有搜索蜘蛛收录

程序占用资源太多的原因：

有一个或多个ACCESS数据库在多次读写过程中损坏，微软的MDAC系统在写入这个损坏的ACCESS文件时，ASP线程处于BLOCK状态，结果其他线程只能等待，IIS被死锁了，全部的CPU时间都消耗在DLLHOST（ASP进程）中。参考解决办法：压缩和修复我的数据库下载数据库文件--[如果是.asp的扩展名，请改为.mdb的扩展名]--用ACCESS打开--选择工具--数据库实用工具--压缩和修复数据库--[改回.asp的扩展名]--上传覆盖原来数据库文件

注册了不良的Com组件，特别是用VB开发的ACTIVE X控件，可能导致占用内存使用量不断增长参考解决办法：尽量减少或避免非官方或是客户要求的不必要的组件

多媒体等文件下载占用服务器带宽参考解决办法：停止下载

程序问题需要及时的关闭不再使用的数据库，以避免一直占用服务器资源在conn.asp 连接数据库字符串语句中加入如下 sub endConnection() conn.close set conn=nothing end sub 其它程序问题：把IE选项里显示友好HTTP错误信息的勾取消掉，再访问网站看出现什么错误信息，然后再调试

上传重要的数据库等文件更新，由于正处于受访问状态，可能导致瞬间占用率上升一般此情况较少，若有出现此情况时，可能有必要先暂停站点，再作更新

ACCESS论坛（如动W）大了以后就很容易出现数据库方面的问题，当你的论坛数据库在30M以上，帖子5万左右,可能就会出现数据库吃不消的情况

建议取消程序中使用的on error resume next这个容错语句，对错误进行调试。临时解决办法：定期删除多余的数据、压缩数据库，限制论坛灌水，甚至限制论坛注册。如果是ASP论坛，可以使用分表储存功能，会有较好的效果比较长远办法：更换论坛和数据库，一般都采用商业版本+MSSQL 的方案来解决

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/472368.html

详解基于UDP的低延时网络传输层协议——QUIC

发表评论

评论列表（0条）

详解基于UDP的低延时网络传输层协议——QUIC

发表评论

评论列表（0条）

请登录