查看原文
其他

多图慎入,从四层模型上解析网络是怎么连接的

脚本之家 2022-04-23

The following article is from java小杰要加油 Author 好懂事一男的

 关注
脚本之家
”,与百万开发者在一起

来源 | java小杰要加油(ID:xhJaver)

 今天来分享一个关于计算机网络的知识点——网络到底是怎么连接的?

浏览器生成消息且发送

  • 发送一个消息的总体流程如下

生成HTTP请求消息

举个栗子,当我们在浏览器输入https://www.jdl.cn/img/service.843585b7.png网络地址的时候

  • 浏览器首先会对URL进行解析
    • https:表示访问数据源的机制,也就是协议
    • www.jdl.cn: web服务器名称
    • img:表示目录名
    • service.843585b7.png:表示文件名        然后就要生成HTTP消息了,它大概长这样

DNS域名解析为IP地址

浏览器生成了这个HTTP消息后,它要往哪里发送呢?当然是服务器啦,所以就要解析这个域名对应的是哪台服务器,IP地址是什么,因为IP地址不好记,所以才有了对应的域名,便于我们人类记忆。

  1. 浏览器会检查缓存有没有这个域名对应的ip地址
  2. 操作系统会检查缓存(就是我们平常说的hosts文件)
  3. 操作系统会发送给本地区的DNS服务器,让它帮忙解析下      DNS服务器接受来自客户端的查询,包括以下三个内容
  • 域名:服务器,邮件服务器的名称
  • Class:在最早设计DNS时,DNS在互联网以外的其他网络中的应用也被考虑到了,而Class就是用来识别网络信息的,不过如今除了互联网就没有其他网络了,因此Class的值永远代表互联网的IN
  • 记录类型:表示域名对应何种记录类型
    • A记录时,域名直接对应IP地址
    • CNAME时,此域名对应其他域名
    • MX时,表示域名对应的是邮件服务器        对于不同的记录类型,响应数据也不一样

域名的层次结构

  • 越靠右层次越高,从右向左一级一级的划分 : 例如 www.jdl.cn 就是cn->jdl->www
  • 具有这种层次结构的域名信息都会注册到DNS服务器中,而每个域都是作为一个整体来处理的      客户端和DNS服务器交互流程大概如下
  • 上级DNS服务器中要注册其下级域的DNS服务器IP地址,然后上级DNS服务器IP地址要注册到更上一级的DNS服务器中,此次类推
  • 根域的DNS服务器信息保存到互联网中所有的DNS服务器中,这样的话,所有的DNS服务器都会找到根域,然后一级一级的往下找,直到找到自己想要的那个域名
  • 分配给根域的IP地址仅有13个,就是顶级域名(com,cn等)对应的ip地址具体交互就是下面这样

但是一台服务器存不下这么多,所以一般都是DNS服务器大接力来寻找这个ip地址,图如下

客户端找到最近的DNS服务器,查找www.jdl.cn的信息,可是最近的DNS服务器没有这个信息,就转发到了根域服务器下,经过判断发现是cn的顶级域名的,于是根域DNS服务器会返回它所管理的cn域中的DNS服务器的ip地址,接下来,最近的这个DNS服务器又回去访问com域名的服务器,以此类推,最终会找到 www.jdl.cn这个服务器的IP地址

委托协议栈发送消息

知道了IP地址后,就可以委托操作系统内部的协议栈向这个目标IP地址发送消息了

  • 协议栈的内部结构
  • 浏览器、邮件等一般应用程序收发数据时用TCP
  • DNS查询等收发较短的控制数据用UDP

网络分层

  • OSI七层模型

开放式系统互联通信参考模型(英语:Open System Interconnection Reference Model,缩写为 OSI),简称为OSI模型(OSI model),一种概念模型,由国际标准化组织提出,一个试图使各种计算机在世界范围内互连为网络的标准框架。定义于ISO/IEC 7498-1。

  • TCP/IP四次模型
    • 应用层:HTTP、DNS、FTP
    • 传输层:TCP、UDP
    • 网络层:IP
    • 网络接口层

TCP/IP(Transmission Control Protocol/Internet Protocol,传输控制协议/网际协议)TCP/IP协议不仅仅指的是TCP 和IP两个协议,而是指一个由FTP、SMTP、TCP、UDP、IP等协议构成的协议簇, 只是因为在TCP/IP协议中TCP协议和IP协议最具代表性,所以被称为TCP/IP协议

客户端服务器传递数据流程

  • 一个数据包从客户端到服务端中间经过每一层都需要加工处理
  • 客户端这边需要不断的给数据包添加头部
  • 服务端这边需要不断的拆分这个数据包

三次握手

当两台计算机要传递数据的时候,一定要先连接,得经过TCP三次握手吧(仅仅指指走TCP协议需要连接的),我们平常都说TCP连接要经过三次握手,我们就来看一下到底什么是TCP三次握手,如图所示

  • 客户端要发送的时候,主动从closed状态打开,服务器启动后就一直处于监听LISTEN状态
  • 客户端发送 SYN = 1,seq = x 给服务端,客户端处于SYN_SEND状态。
  • 服务端收到后给客户端发送 SYN = 1,ACK =1, seq = y,ack = x+1。此时服务端处于SYN_RCVD状态
  • 客户端收到后发送ACK =1, seq = x+1,ack = y+1给服务器,此时客户端状态是ESTAB-LISHED
  • 服务端收到后状态变为ESTAB-LISHED
  • 三次握手通过后,就代表客户端和服务端可以传递数据包进行交互啦
  • 我们说到SYN,ACK,seq,ack这些又是什么呢?这些其实是TCP数据包里的属性,我们接着往下看(在传输层中有解释)

应用层

HTTP数据包拆分

  • 一般HTTP请求消息不会太长,一个网络包就能装的下
  • 发送缓冲区中的数据如果超过MSS的长度,就会被以MSS长度进行拆分放进单独的网络包中
  • MTU(Maximum Transmission Unit):一个网络包的最大长度,以太网中一般是1500字节
  • MSS(Maximum Segment Size):除去头部之后,一个网络包所容纳的TCP数据的最大长度

传输层

  • 然后上面应用层的这个网络包再加上TCP头部

TCP报文格式

  • 源端口号(16位):发送网络包的端口号
  • 目的端口号(16位):网络包的接受方的端口号
  • 序号(发送数据的顺序编号)(32位):发送方告知接收方已经收到了所有数据的第几个字节
  • 确认序号(接收数据的顺序编号)(32位):接收方告知发送方接收方已经收到了所有数据的第几个字节
  • 头部长度(4位):表示数据的起始部分,数据偏移量
  • 保留(6位):该字段为保留,现在未使用
  • 控制位(6位):该字段中的每个比特位分别表示以下通信控制的含义
    • URG:表示紧急指针字段有效
    • ACK:表示接收数据序号字段有效,一般表示数据已被接收方收到
    • PSH:表示通过flush操作发送的数据
    • RST:强制断开连接,用于异常中断的情况
    • SYN:发送方和接收方相互确认序号,表示连接操作
    • FIN:表示断开操作
  • 窗口大小(16位):接收方告知发送方窗口大小(即无需等待确认可一起发送的数据)
  • 校验和(16位):用来检查是否出现错误
  • 紧急指针(16位):表示应急处理的数据位置
  • 可选字段(可变长度):除了上面的固定头部字段外,还可以添加可选字段,但除了连接操作外,很少使用可选字段

还记三次握手提到过的各种序号吗,就是这个报文里的属性

网络层

  • 然后上面这个网络包再加上IP头部

IP报文格式

  • 版本号(4比特):IP协议版本号,目前是版本4
  • 头部长度(4比特):IP头部的长度,可选字段可导致头部长度的变化,因此这里需要指定头部的长度
  • 服务类型(TOS)(8比特):表示包传输优先级。最初的协议规格里对这个参数的定义很模糊,最近DIFFServ规则重新定义了这个字段的用法
  • 总长度(16比特):表示IP消息的总长度
  • ID号(16比特):用于识别包的编号,一般为的序列号。如果一个包被IP分片,则所有分片都拥有相同的ID
  • 标志(Flag)(3比特):该字段有3个比特,其中2个比特有效,分别代表是否允许分片,以及当前分片是否为分片包
  • 分片偏移量(13比特):表示当前包的内容为整个IP消息的第几个字节开始的内容
  • 生存时间(TTL)(8比特):表示包的生存时间,这是为了避免网络出现回环时一个包永远在网络中打转。每经过一个路由器,这个值就会减一,减到0的是hi这个包就会被丢弃
  • 协议号(8比特):协议号表示协议的类型(以下均为16进制)
    • TCP:06
    • UDP:17
    • ICMP:01
  • 头部校验和(16比特):用于检查错误,现在已经不在使用
  • 发送方IP地址(32比特):网络包发送方的IP地址
  • 接收方IP地址(32比特):网络包接收方的IP地址
  • 可选字段(可变长度):除了上面的固定头部字段外,还可以添加可选字段,但除了连接操作外,很少使用可选字段
  • 然后这个网络包再加上MAC头部

MAC数据包

  • 接收方MAC地址(48比特):网络包接收方的MAC地址,在局域网中使用这一地址来传输网络包
  • 发送方MAC地址(48比特):网络包发送方的MAC地址,接收方通过它来判断是谁发送了这个网络包
  • 以太类型(16比特):使用的协议类型。下面是一些常见的类型,一般在TCP/IP通信中只是用0800和0806这两种。
    • 0000-05DC:IEEE 802.3
    • 0800 :IP协议
    • 0806 :ARP协议
    • 86DD :IPV6

MAC地址 VS  IP地址

  • IP头部前面还会加上MAC头部
  • 为什么需要MAC数据包呢?因为在以太网的世界中,TCP/IP这个思路是行不通的。
  • 以太网在判断网络包目的地时和TCP/IP的方式不同,因此必须采用想匹配的方式才能在以太网中将包发往目的地,而MAC地址就是干这个的
  • 发送方MAC地址:MAC地址是写在网卡生产时写入ROM里的,只需要将这个值读取出来写入MA头部就好了

发送方的MAC地址还比较容易获取到,但是接收方的MAC地址就不太容易获取到了

ARP广播

  • ARP :Addresss  Resolution  Protocal 地址解析协议
  • 根据IP地址查询接收方MAC地址的时候会用到ARP广播
  • 在同一个子网中,利用广播对所有设备提问 XXX这个ip地址是谁的,其他设备发现自己的ip地址是这个xxx的话,那么他就会把它的MAC地址告诉提问者,这样就会检测到接收方的MAC地址了,如果发现自己的ip地址不是这个XXX,那么则会丢弃这个消息并不去理会。
  • 如果每次都去广播的话,那么网络中就会增加很多ARP包,所以为了提高效率,我们有ARP缓存在内存中。查询之前先去查询ARP缓存。
  • 当目的地的IP地址对应的MAC地址变了的话,那么这个MAC缓存就会出问题,所以为了避免这种问题发生,这个缓存几分钟后会被删除,非常简单粗暴。
    • 静态ARP:手工维护,不会自动失效
    • 动态ARP:会过段时间自动失效(文中说的就是它)
  • IP 模块负责添加如下两个头部:
    • MAC头部:以太网用的头部,包含MAC地址
    • IP头部:IP用的头部,包含IP地址

总体数据包

这个时候的数据包变成了这个样子

  • MTU(Maximum Transmission Unit):一个网络包的最大长度,以太网中一般是1500字节

  • MSS(Maximum Segment Size):除去头部之后,一个网络包所容纳的TCP数据的最大长度

  • 然后这数据包,沿着网卡出去,到集线器,路由器一顿传输(中间涉及到电信号转换等等),到达服务端那边,再一层一层的扒皮(前往中说过,一层一层的拆分数据包)

断开连接

四次挥手

两台计算机最后连接结束后要断开连接,进行四次挥手

其实三次握手四次挥手还有好多好多知识点要说,像什么为什么握手需要三次,而挥手需要四次啦这些问题,以后小杰会单独和大家聊这个,记得收看呀

end


观看视频,参加留言送书活动 

↓↓↓

小编会从视频评论区挑选认真的留言
赠送【脚本之家小程序 积分【可兑换礼物

计算机优秀书籍每周销售排行榜

中国芯片能不能弯道超车,就看量子计算了

955 加班少的公司名单来了!

腾讯首个全自研的机器狗长啥样?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存