OkHttp源码解析 (三)——代理和路由

OkHttp源码解析 (三)——代理和路由,第1张

初看OkHttp源码,由于对Address、Route、Proxy、ProxySelector、RouteSelector等理解不够,读源码非常吃力,看了几遍依然对于寻找复用连接、创建连接、连接服务器、连接代理服务器、创建隧道连接等逻辑似懂非懂,本篇决定梳理一遍相关的概念及基本原理。

● HTTP/1.1(HTTPS)

● HTTP/2

● SPDY

一个http请求的流程(直连):

1、输入url及参数;

2、如果是url是域名则解析ip地址,可能对应多个ip,如果没有指定端口,则用默认端口,http请求用80;

3、创建socket,根据ip和端口连接服务器(socket内部会完成3次TCP握手);

4、socket成功连接后,发送http报文数据。

一个https请求的流程(直连):

1、输入url及参数;

2、如果是url是域名则解析ip地址,可能对应多个ip,如果没有指定端口,则用默认端口,https请求用443;

3、创建socket,根据ip和端口连接服务器(socket内部会完成3次TCP握手);

4、socket成功连接后进行TLS握手,可通过java标准款提供的SSLSocket完成;

5、握手成功后,发送https报文数据。

1、分类

● HTTP代理:普通代理、隧道代理

● SOCKS代理:SOCKS4、SOCKS5

2、HTTP代理分类及说明

普通代理

HTTP/1.1 协议的第一部分。其代理过程为:

● client 请求 proxy

● proxy 解析请求获取 origin server 地址

● proxy 向 origin server 转发请求

● proxy 接收 origin server 的响应

● proxy 向 client 转发响应

其中proxy获取目的服务器地址的标准方法是解析 request line 里的 request-URL。因为proxy需要解析报文,因此普通代理无法适用于https,因为报文都是加密的。

隧道代理

通过 Web 代理服务器用隧道方式传输基于 TCP 的协议。

请求包括两个阶段,一是连接(隧道)建立阶段,二是数据通信(请求响应)阶段,数据通信是基于 TCP packet ,代理服务器不会对请求及响应的报文作任何的处理,都是原封不动的转发,因此可以代理 HTTPS请求和响应。

代理过程为:

● client 向 proxy 发送 CONNET 请求(包含了 origin server 的地址)

● proxy 与 origin server 建立 TCP 连接

● proxy 向 client 发送响应

● client 向 proxy 发送请求,proxy 原封不动向 origin server 转发请求,请求数据不做任何封装,为原生 TCP packet.

3、SOCKS代理分类及说明

● SOCKS4:只支持TCP协议(即传输控制协议)

● SOCKS5: 既支持TCP协议又支持UDP协议(即用户数据包协议),还支持各种身份验证机制、服务器端域名解析等。

SOCK4能做到的SOCKS5都可得到,但反过来却不行,比如我们常用的聊天工具QQ在使用代理时就要求用SOCKS5代理,因为它需要使用UDP协议来传输数据。

有了上面的基础知识,下面分析结合源码分析OkHttp路由相关的逻辑。OkHttp用Address来描述与目标服务器建立连接的配置信息,但请求输入的可能是域名,一个域名可能对于多个ip,真正建立连接是其中一个ip,另外,如果设置了代理,客户端是与代理服务器建立直接连接,而不是目标服务器,代理又可能是域名,可能对应多个ip。因此,这里用Route来描述最终选择的路由,即客户端与哪个ip建立连接,是代理还是直连。下面对比下Address及Route的属性,及路由选择器RouteSelector。

描述与目标服务器建立连接所需要的配置信息,包括目标主机名、端口、dns,SocketFactory,如果是https请求,包括TLS相关的SSLSocketFactory 、HostnameVerifier 、CertificatePinner,代理服务器信息Proxy 、ProxySelector 。

Route提供了真正连接服务器所需要的动态信息,明确需要连接的服务器IP地址及代理服务器,一个Address可能会有很多个路由Route供选择(一个DNS对应对个IP)。

Address和Route都是数据对象,没有提供操作方法,OkHttp另外定义了RouteSelector来完成选择的路由的操作。

1、读取代理配置信息:resetNextProxy()

读取代理配置:

● 如果有指定代理(不读取系统配置,在OkHttpClient实例中指定),则只用1个该指定代理;

● 如果没有指定,则读取系统配置的,可能有多个。

2、获取需要尝试的socket地址(目标服务器或者代理服务器):resetNextInetSocketAddress()

结合Address的host和代理,解析要尝试的套接字地址(ip+端口)列表:

● 直连或者SOCK代理, 则用目标服务器的主机名和端口,如果是HTTP代理,则用代理服务器的主机名和端口;

● 如果是SOCK代理,根据目标服务器主机名和端口号创建未解析的套接字地址,列表只有1个地址;

● 如果是直连或HTTP代理,先DNS解析,得到InetAddress列表(没有端口),再创建InetSocketAddress列表(带上端口),InetSocketAddress与InetAddress的区别是前者带端口信息。

3、获取路由列表:next()

选择路由的流程解析:

● 遍历每个代理对象,可能多个,直连的代理对象为Proxy.DIRECT(实际是没有中间代理的);

● 对每个代理获取套接字地址列表;

● 遍历地址列表,创建Route,判断Route如果在路由黑名单中,则添加到失败路由列表,不在黑名单中则添加到待返回的Route列表;

● 如果最后待返回的Route列表为空,即可能所有路由都在黑名单中,实在没有新路由了,则将失败的路由集合返回;

● 传入Route列表创建Selection对象,对象比较简单,就是一个目标路由集合,及读取方法。

为了避免不必要的尝试,OkHttp会把连接失败的路由加入到黑名单中,由RouteDatabase管理,该类比较简单,就是一个失败路由集合。

1、创建Address

Address的创建在RetryAndFollowUpInteceptor里,每次请求会声明一个新的Address及StreamAllocation对象,而StreamAllocation使用Address创建RouteSelector对象,在连接时RouteSelector确定请求的路由。

每个Requst都会构造一个Address对象,构造好了Address对象只是有了与服务器连接的配置信息,但没有确定最终服务器的ip,也没有确定连接的路由。

2、创建RouteSelector

在StreamAllocation声明的同时会声明路由选择器RouteSelector,为一次请求寻找路由。

3、选择可用的路由Route

下面在测试过程跟踪实例对象来理解,分别测试直连和HTTP代理HTTP2请求路由的选择过程:

● 直连请求流程

● HTTP代理HTTPS流程

请求url: https://www.jianshu.com/p/63ba15d8877a

1、构造address对象

2、读取代理配置:resetNextProxy

3、解析目标服务器套接字地址:resetNextInetSocketAddress

4、选择Route创建RealConnection

5、确定协议

测试方法:

● 在PC端打开Charles,设置端口,如何设置代理,网上有教程,比较简单;

● 手机打开WIFI,选择连接的WIFI修改网络,在高级选项中设置中指定了代理服务器,ip为PC的ip,端口是Charles刚设置的端口;

● OkHttpClient不指定代理,发起请求。

1、构造address对象

2、读取代理配置:resetNextProxy

3、解析目标服务器套接字地址:resetNextInetSocketAddress

4、选择Route创建RealConnection

5、创建隧道

由于是代理https请求,需要用到隧道代理。

从图可以看出,建立隧道其实是发送CONNECT请求,header包括字段Proxy-Connection,目标主机名,请求内容类似:

6、确定协议,SSL握手

1、代理可分为HTTP代理和SOCK代理;

2、HTTP代理又分为普通代理和隧道代理;普通代理适合明文传输,即http请求;隧道代理仅转发TCP包,适合加密传输,即https/http2

3、SOCK代理又分为SOCK4和SOCK5,区别是后者支持UDP传输,适合代理聊天工具如QQ;

4、没有设置代理(OkHttpClient没有指定同时系统也没有设置),客户端直接与目标服务器建立TCP连接;

5、设置了代理,代理http请求时,客户端与代理服务器建立TCP连接,如果代理服务器是域名,则解释代理服务器域名,而目标服务器的域名由代理服务器解析;

6、设置了代理,代理https/http2请求时,客户端与代理服务器建立TCP连接,发送CONNECT请求与代理服务器建立隧道,并进行SSL握手,代理服务器不解析数据,仅转发TCP数据包。

如何正确使用 HTTP proxy

OkHttp3中的代理与路由

HTTP 代理原理及实现(一)

我正在做与你同样的工作,我选择了mongoose,一款开源的http服务器。

http://code.google.com/p/mongoose/

这是它的网站,可以下载源码,并且协议非常自由。

有不明白之处可以联系我。我正在基于mongoose进行开发。

=========================================

源码在这里可以下载到,http://code.google.com/p/mongoose/downloads/list

我也只是一个c程序员,不太会网络编程。但用mongoose的确非常简单,因为就是c++写的,你应该看起来不费劲。

OkHttp 是适用于 Android 和 Java 应用程序的高效HTTP客户端。最早的版本是基于 HttpURLConnection 和 HttpClient 的封装,之后 Android 6.0 版移除了对 Apache HTTP 客户端的支持 ,OkHttp 也移除了 HttpClient,然后移除 HttpURLConnection 的底层支持,连接底层到应用全部自己实现,成为业界公认最佳方案,HttpURLConnection 的底层实现也改为了 OkHttp 的实现方式。

优势:

从 call.enqueue 开始,查看方法实现:

这是一个抽象方法,所以需要回到 Call call = client.newCall(request) ,查看 newCall 的实现,

那么真正调用 enqueue 的是 RealCall ,查看 RealCall 里 enqueue 的实现:

callStart() 是一个监听器,监听请求的开始,重点在这里: client.dispatcher.enqueue(AsyncCall(responseCallback)) 。点进 dispatcher :

通过注释,可以知道这是一个使用 ExecutorService 的线程调度器。

可以 Set 的同时执行的最大请求数,默认同时执行64个请求。

每个主机能同时执行的最大请求数,默认是5个。

内部使用一个核心线程数为0、容量无限大、60秒超时的线程池。

查看 enqueue :

readyAsyncCalls.add(call) 把准备执行但未执行的 AsyncCall 放入队列,然后记录主机连接数,最后调用 promoteAndExecute() :

遍历队列,挑选符合条件可以被执行的 Call ,把他们放在正在执行的队列,然后调用 asyncCall.executeOn(executorService) 执行:

executorService.execute(this) 这里既然传入了 this ,那么这个类肯定实现了 Runnable 接口:

我们查看 AsyncCall 的 run 方法,找出怎么执行的:

val response = getResponseWithInterceptorChain() 这里直接返回的是 Response,说明 getResponseWithInterceptorChain 里会发起请求和返回,核心也就在这里。

下面看下同步请求的执行:

很简单,直接调用 getResponseWithInterceptorChain() 。

整体架构分析到此,下一篇详细分析 getResponseWithInterceptorChain() 。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/277769.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-20
下一篇2023-04-20

发表评论

登录后才能评论

评论列表(0条)

    保存