五分钟了解网络连接_服务器知识

前言：笔者最近阅读大量网络原理相关书籍，因此总结出此文，读完本文，读者们应该要了解下面名词：

网络原理系列文章：

一、五分钟了解网络连接(已完成)

二、收发数据的原理(上)(已完成)

三、收发数据的原理(下)(已完成)

四、收发数据的番外篇(未完成)

HTTP协议定义了客户端和服务端之间交互的消息内容和步骤。首先，客户端向服务器发送请求消息，请求消息包含两部分（“对什么”和“进行怎样的操作”）。“对什么”是指访问目标（URI），“进行怎样的操作”则是指方法，也称HTTP谓词。收到请求消息后，Web 服务器会对其中的内容进行解析，通过接收的URI和方法完成自己的工作，然后将结果存放在响应消息中，返回给客户端。

使用GET方法的情况下，仅凭方法和URI，Web 服务器就能判断需要进行怎样的操作，因此消息体中不需要填写任何数据。而POST则需要消息体。

我们把请求消息发送出去之后，Web服务器会返回响应消息。其中会有状态码和响应短语。

生成HTTP消息之后，我们需要委托操作系统将消息发送给Web服务器。

IP地址科普：

TCP/IP网络是通过IP地址来确定通信对象，因此不知道IP地址就无法将消息发送给对方，这跟我们打电话需要知道对方的电话号码一样才可以。

可能有人会问，为什么不直接用IP地址去访问网址，确实，我们直接输入IP地址是可以访问的。但是IP地址那串数字，难以记住。比如百度的网址，不是“ www.baidu.com ”，而是“202.96.128.99”，你怎么记住呢？

然后你可能又会问，干么不直接用域名去确定通信对象呢，其实，这是可以的，但是这会影响运行效率。

DNS服务器可以帮我们查询到IP地址。

解析器生成要给DNS服务器的查询消息，但是解析器本身也不具备使用网络收发数据的功能(之所以用“也”，是因为这一过程跟浏览器生成HTTP消息发送给Web服务器类似)，所以需要委托协议栈(操作系统内部的网络控制软件，也叫“协议驱动”、“TCP/IP驱动”)执行操作，再通过网卡发给DNS服务器。

DNS的基本工作就是接受来自客户端查询消息，然后根据消息的内容返回响应。其中，客户端的消息包含3中信息

互联网中不计其数的服务器，所以存储他们信息的只用一台DNS服务器是不可能的，需要将信息分布在多台DNS服务器，然后它们相互接力配合，从而查找出要查的信息。DNS服务器中所有信息都是按照域名以分层次的结构保存。类似公司中的事业集团、部门、科室结构。

DNS中的域名是用句点来分隔的，域名越靠右的位置表示层级越高。比如：“ www.ituring.com.cn ”域名，cn 是公司集团，com 是研发部， ituring 是后台小组，所以可以理解为某公司集团cn 下的com 研发部的 ituring 后台小组的 www。其中相当一个层级的部分称为域，即 com 域的下一层级是 ituring 域，再下一层才是 www 这个名字

有时我们会看到类似这种“sports.qq.com”、“finance.qq.com ”,这两者有什么关联吗？

这两者其实就是某讯旗下的体育和金融版本,“qq.com”是他的公司域，因为不可能说一个公司的不同板块（或者说不同的事业集团），我给你公司多个DNS服务器，一个域是不可分割的。解决办法是建立子域。例如某讯就是在公司域“qq.com”的下面建立子域“sports.qq.com”、“finance.qq.com ”

找到DNS服务器中存放的信息，关键是找到信息归哪台DNS服务器管。

HTTP的三次握手、四次挥手

https://blog.csdn.net/AI_Gentleman/article/details/81209053

互联网有无数台DNS服务器，不可能一台一台挨个找。所以采取以下方法。首先，将负责管理下级域的DNS服务器的IP地址注册到他们的上级DNS服务器中，然后上级DNS服务器的IP地址再注册到更高一级的DNS服务器中，以此类推。

在互联网中，比com和cn更高一级，称为根域。根域在域名的最后加上一个点，如“ www.baidu.com .”最后的那个句点代表根域名，但是那个句点经常被省略,根域的DNS服务器保管着com、cn等DNS服务器的信息。由于上级DNS服务器保管着所有下级DNS服务器的信息，所以我们可从根域开始一路往下顺藤摸瓜找到任意一个域的DNS服务器。

另外，根域的DNS服务器信息存在互联网中所有的DNS服务器中。分配给根域DNS服务器的IP地址只有13个。

下面以“ www.gov.cn ”和“ sports.qq.com ”举例说明DNS服务器查找流程

有时候不需要从最上级的根域开始查找，因为DNS服务器有一个缓存功能，可以记住之前的域名。如果要查询的域名和相关信息已经在缓存中，那么可以直接从缓存处得到所需信息，然后从缓存位置开始向下查找。这样对比与从根域开始，减少了查询时间。

当查询的域名不存在时，缓存也会存储起来，下次查询时，直接快速反应。

如果信息被缓存了，原本的注册信息可能会发生改变，那么缓存中的信息就可能不正确了，因此，DNS服务器中保存的信息设置一个有效期，当缓存中的信息超过有效期后，数据就会从缓存中删除。

获悉ip之后，就可以委托操作系统内部的协议栈发送消息到目标IP地址，也就是发送到Web服务器，发送给Web服务器的HTTP消息是一种数字消息。

实际过程，可把收发数据总结为四步：

参考文献：

域名知识百科

网络是怎样连接的

互联网的实现，分为好几层，每一层都有自己特有的功能，而且每一层都靠下一层支持。用户接触到的，只是最上面的一层，我们称为应用层，要理解互联网，必须从最下层开始，自下而上的理解每一层的功能。

我们常见的网络模型，有以下三种：

它们之间的关系如下图所示

其中，理论五层模型是综合 OSI七层和 TCP/IP四层的优点，采用的一种原理体系结构。 我们接下来的探讨也是基于理论五层模型来展开的。

理论五层模型的结构如下图

各层的作用如下：

简单说，越下面的层，越靠近硬件；越上面的层，越靠近用户。

每一层都是为了完成某一种功能。为了实现这些功能，需要遵守一些共同的规则，这些规则就是协议(protocol) 。

互联网的每一层，都定义了很多协议。这些协议的总称，叫做互联网协议(Internet Protocol Suite) ，它们是互联网的核心。

下面的内容中，我们通过每一层的功能的介绍，对每一层中的主要协议所起作用进行讲解。

电脑要进行联网，需要把电脑通过各种设备连接进网络，设备有光缆、电缆、双绞线、无限电波等方式。

物理层是用于传输信号的介质，它传输的是 0和1 的电信号。但是关于电信号如何分组,每个信号位有何意义并没有规定。

这就是数据链路层的功能，它在物理层的上方，确定了0和1的分组方式，用于两个设备(同一种数据链路结点)之间进行信息传递。

早期的时候，每家公司都有自己的电信号分组方式。逐渐地，一种叫做以太网(Ethernet) 的协议，占据了主导地位。

以太网规定，一组电信号构成一个数据包，叫做帧(frame) ，每一帧分为两个部分：标头(Head) 和数据(Data) 。

MTU是链路层对物理层的限制。

由于链路层存在MTU的限制，导致网络层的报文如果超过1500字节，就必要要对其进行分片发送。

上面我们提到，以太网数据包的标头，包含了发送者和接受者的信息。那么，发送者和接受者是如何标识呢？

以太网规定，连入网络的所有设备，都必须具有网卡接口。数据包必须是从一块网卡，传送到另一块网卡。 网卡的地址，就是数据包的发送地址和接收地址，这叫做 MAC地址。

每块网卡出厂的时候，都有一个全世界独一无二的MAC地址，长度是 48个二进制位，通常用 12个十六进制数表示。

前6个十六进制数是厂商编号，后6个十六进制数是该厂商的网卡流水号。有了MAC地址，就可以定位网卡和数据包的路径了。

定义地址只是第一步，后面还有更多的步骤：

上图中，5号计算机向3号计算机发送一个数据包，同一个子网络的1号、2号、3号、4号、6号计算机都会收到这个包。它们读取这个包的标头，找到接收方的MAC地址，然后与自身的 MAC地址相比较，如果两者相同，就接收这个包，做进一步处理，否则就丢弃这个包。这种发送方式就叫做广播（broadcasting）。

有了数据包的定义、网卡的MAC地址、广播的发送方式，"链接层"就可以在多台计算机之间传送数据了。

以太网协议，依靠MAC地址发送数据。理论上，单单依靠MAC地址，成都的网卡就可以找到休斯顿的网卡了，技术上是可以实现的。

但是，这样做有一个重大的缺点。以太网采用广播方式发送数据包，所有成员人手一包，不仅效率低，而且局限在发送者所在的子网络。也就是说，如果两台计算机不在同一个子网络，广播是传不过去的。这种设计是合理的，否则互联网上每一台计算机都会收到所有包，那会引起灾难。

互联网是无数子网络共同组成的一个巨型网络，很像想象成都和休斯顿的电脑会在同一个子网络，这几乎是不可能的。

因此，必须找到一种方法，能够区分哪些MAC地址属于同一个子网络，哪些不是。如果是同一个子网络，就采用广播方式发送，否则就采用路由方式发送。（路由的意思，就是指如何向不同的子网络分发数据包，这是一个很大的主题，本文不涉及。）遗憾的是，MAC地址本身无法做到这一点。它只与厂商有关，与所处网络无关。

这就导致了网络层的诞生。 它的作用是引进一套新的地址，使得我们能够区分不同的计算机是否属于同一个子网络 。这套地址就叫做网络地址，简称网址。

于是，网络层出现以后，每台计算机有了两种地址，一种是 MAC地址，另一种是网络地址。两种地址之间没有任何联系，MAC地址是绑定在网卡上的，网络地址则是管理员分配的，它们只是随机组合在一起。

网络地址帮助我们确定计算机所在的子网络，MAC地址则将数据包送到该子网络中的目标网卡。因此，从逻辑上可以推断，必定是先处理网络地址，然后再处理MAC地址。

规定网络地址的协议，叫做 IP协议。它所定义的地址，就被称为 IP地址。目前，广泛采用的是IP协议的第四版和第六版，分别称为IPv4和IPv6。

互联网上的每一台计算机，都会分配到一个IP地址。这个地址分成两个部分，前一部分代表网络，后一部分代表主机。比如，IP地址14.215.177.39，这是一个32位的地址，假定它的网络部分是前24位（14.215.177），那么主机部分就是后8位（最后的那个1）。处于同一个子网络的电脑，它们IP地址的网络部分必定是相同的，也就是说14.215.177.2应该与14.215.177.1处在同一个子网络。

但是，问题在于单单从IP地址，我们无法判断网络部分。还是以14.215.177.39为例，它的网络部分，到底是前24位，还是前16位，甚至前28位，从IP地址上是看不出来的。

那么，怎样才能从IP地址， 判断两台计算机是否属于同一个子网络呢？这就要用到另一个参数子网掩码（subnet mask） 。

子网掩码 ：

我们知道，IPv4的地址只有32位，地球上网民数量已经远远超出这个数字，那么，为啥至今还没出现地址枯竭呢？

因为我们还有一些技术，可以变相的缓解地址不足，比如NAT技术。

NAT（Network Address Translation，网络地址转换）

IPv6拥有128位巨大的地址空间，对于那么大的空间，也不是随意的划分，而是使用按照bit位进行号段划分。

IPv6地址结构如下图

例如 RFC4291 中定义了n=48, m=16，也就是子网和接口ID与各占64位。

IPv6没有子网掩码mask的概念，它支持的是子网前缀标识方法。

使用 IPv6地址/前缀长度表示方法，例如：

可以看到，一个IPv6的地址有子网前缀+接口ID构成，子网前缀由地址分配和管理机构定义和分配，而接口ID可以由各操作系统实现生成。

IPv6是用来解决IPv4 地址枯竭问题的，IPv4地址为32位，而IPv6地址为 128位

除了地址数量以外，IPv6还有很多优点，例如：

如上所述，IP协议的作用主要有两个：

根据IP协议发送的数据，就叫做 IP数据包。我们直接把IP数据包直接放进以太网数据包的"数据"部分，不用修改以太网的规格。这就是互联网分层结构的好处： 上层的变动完全不涉及下层的结构 。

具体来说，IP数据包也分为标头和数据两个部分：

其中，标头范围为 20-60字节 ( IPv6固定为40字节 )，整个数据包的总长度最大为65535字节。因此，理论上，一个IP数据包的数据部分，最长为65515字节。

如图所示，标头中 20字节是固定不变的，它包含了版本、长度、IP地址等信息，另外还有可变部分的标头可选。而数据则是IP数据包的具体内容。

将它放入以太网数据包后，以太网数据包就变成了下面这样：

在以太网协议中，以太网数据包的数据部分，最长只有1500字节。因此， 如果IP数据包超过了1500字节，它就需要分割成几个以太网数据包，分开发送了 。

关于网络层，还有最后一点需要说明。因为IP数据包是放在以太网数据包里发送的，所以我们必须同时知道两个地址，一个是对方的 MAC地址，另一个是对方的 IP地址。通常情况下，对方的IP地址是已知的，但是我们不知道它的MAC地址。

所以，我们需要一种机制，能够从IP地址得到MAC地址。

这里又可以分成两种情况：

总之，有了ARP协议之后，我们就可以得到同一个子网络内的主机MAC地址，可以把数据包发送到任意一台主机之上了。

ARP攻击是利用ARP协议设计时缺乏安全验证漏洞来实现的，通过伪造ARP数据包来窃取合法用户的通信数据，造成影响网络传输速率和盗取用户隐私信息等严重危害。

ARP攻击主要是存在于局域网网络中，局域网中若有一台计算机感染ARP木马，则感染该ARP木马的系统将会试图通过“ARP欺骗”手段截获所在网络内其它计算机的通信信息，并因此造成网内其它计算机的通信故障。

局域网中比较常见的ARP攻击包括：上网时断时续，拷贝文件无法完成，局域网内的ARP包激增。出现不正常的MAC地址，MAC地址对应多个IP地址，网络数据发不出去了，网上发送信息被窃取，个人PC中毒局域网内MAC地址泛洪使MAC地址缓存表溢出等问题。据包的协议地址不匹配，从而在网络中产生大量的ARP。

在局域网环境中，ARP攻击是主要的安全威胁，在传统网络中主要是通过静态绑定的方式来解决，但是这种方式限制了网络扩展的易用性。

有了MAC地址和IP地址，我们已经可以在互联网上任意两台主机上建立通信。

接下来的问题是，同一台主机上有许多程序都需要用到网络，比如，你一边浏览网页，一边与朋友在线聊天。当一个数据包从互联网上发来的时候，你怎么知道，它是表示网页的内容，还是表示在线聊天的内容？

也就是说，我们还需要一个参数，表示这个数据包到底供哪个程序（进程）使用。这个参数就叫做端口（port），它其实是每一个使用网卡的程序的编号。每个数据包都发到主机的特定端口，所以不同的程序就能取到自己所需要的数据。

端口是0到65535之间的一个整数，正好16个二进制位。0到1023的端口被系统占用，用户只能选用大于1023的端口。 不管是浏览网页还是在线聊天，应用程序会随机选用一个端口，然后与服务器的相应端口联系。

传输层的功能，就是建立端口到端口的通信 。相比之下， 网络层的功能是建立主机到主机 的通信。只要确定主机和端口，我们就能实现程序之间的交流。因此，Unix系统就把 主机+端口，叫做套接字 （socket）。有了它，就可以进行网络应用程序开发了。

现在，我们必须在数据包中加入端口信息，这就需要新的协议。最简单的实现叫做UDP协议，它的格式几乎就是在数据前面，加上端口号。

UDP数据包，也是由标头和数据两部分组成：

UDP数据包非常简单，标头部分一共只有8个字节，总长度不超过65,535字节，正好放进一个IP数据包。

UDP协议的优点是比较简单，容易实现，但是缺点是可靠性较差，一旦数据包发出，无法知道对方是否收到。为了解决这个问题，提高网络可靠性，TCP协议就诞生了。这个协议非常复杂，但可以近似认为，它就是有确认机制的UDP协议，每发出一个数据包都要求确认。如果有一个数据包遗失，就收不到确认，发出方就知道有必要重发这个数据包了。

因此， TCP协议能够确保数据不会遗失。它的缺点是过程复杂、实现困难、消耗较多的资源。

TCP数据包和UDP数据包一样，都是内嵌在IP数据包的数据部分。 TCP数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常 TCP数据包的长度不会超过IP数据包的长度，以确保单个TCP数据包不必再分割。

应用程序收到传输层的数据，接下来就要进行解读。由于互联网是开放架构，数据来源五花八门，必须事先规定好格式，否则根本无法解读。 应用层的作用，就是规定应用程序的数据格式。

举例来说，TCP协议可以为各种各样的程序传递数据，比如Email、WWW、FTP等等。那么，必须有不同协议规定电子邮件、网页、FTP数据的格式，这些应用程序协议就构成了应用层。这是最高的一层，直接面对用户。它的数据就放在TCP数据包的数据部分。

因此，现在的以太网的数据包就变成下面这样：

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/22208.html

五分钟了解网络连接

发表评论

评论列表（0条）