OSI Transport Layer

OSI层次传输层

关键词可靠性流控制 错误校正

刻画了终端对终端的连接

1. 传输层概述

1.1. 传输层的功能

  • 传输层将上面应用层的数据分段

  • 建立终端到终端的操作

  • 报文段 (segment) 从一台主机端发送到其它主机

  • 流量控制和可靠性

    • ​ 可以比作与外国人对话通常你让外国人重复他的话可靠性然后慢慢的说流量控制

1.2. 两个重要的协议

1.2.1. TCP (Transmission Control Protocol, 传输控制协议)

TCP 是一种面向连接的可靠的基于字节流的传输层通信协议IETF (Internet Engineering Task Force, 因特网工程任务组) 的 RFC 793 定义不同主机的应用层之间经常需要可靠的像管道一样的连接但是IP层不提供这样的流机制而是提供不可靠的包交换因此我们需要 TCP 协议做下面几件事

  • 提供软件的段检查

  • 如果有丢失或者错误重新发送

  • 使用确认

  • 提供流量控制

1.2.2. UDP (User Datagram Protocal, 用户数据包协议)

UDP 是一种面向无连接不可靠的快速传输的传输层通信协议RFC 768定义作为Internet传输层的另外一个重要协议UDP除了给应用程序发送数据包允许它们在所需的层次上架构自己的协议之外几乎没有做什么特别的事情

  • 不提供软件检查段
  • 不使用确认
  • 不提供流操作

1.3. 服务模型

​ TCP和UDP都用端口来跟踪同一时间穿过网络的不同通讯应用软件开发商已经同意使用众所周知的RFC 1700中定义的端口号

  • < 255: TCP 和 UDP 公共应用
  • 256~1023公共端口
  • 1024~49151注册端口
  • 49152~65535客户端进程

值得注意的是IP地址 + 特定的端口号 = 制定的进程

1.4.套接字 (Socket)

​ 关于 Socket 更详细的内容可以查看这篇文章

  • 套接字表示为IP地址:端口号

  • 每一个连接表示为(套接字来源, 套接字目的), 这是一个点对点的全双工信道

  • TCP 不支持 组播 (多播) 和广播

2. TCP(Transmission Control Protocol)

2.1. TCP中必须解决的问题

  • 传输必须是可靠的

  • 流量控制

  • 连接管理

    • 建立连接三次握手 (Three Handshakes)

    • 结束连接四次挥手 (Four Handshakes)

2.2. TCP组成

下图是 TCP 报文段的图示

可以看见TCP 报文段包括固定的 20字节长的首部任意长度的数据段

2.2.1. TCP 协议

  • 主机用段交换数据 (TPDU)

  • 每个段有:

    • 20字节的首部 (不包括可选部分)

    • 更多数据字节

  • 段的大小必须和IP 包匹配也必须满足底层的需求

    • 以太网的MTU(Maximal Transfer Unit最大传输单元) 是1500 字节每个字节有一个32位的序号

2.2.2. TCP 报文段的首部

  • 源端口和目的端口——各占2个字节

    • 端口运输层与应用层的服务接口
    • 运输层的**复用分用**功能都要通过端口才能实现
  • 序号——占4字节

    • 运输层以报文为标识单位第四层以字节为标识单位

    • TCP传送的数据流中的每一个字节都编上一个序号

    • 序号字段的值指本报文所发送的数据的每一个字节的序号

  • 确认号——占4字节

    • 表示期望受到对方的下一个报文段的数据的第一个字节的序号
  • 数据偏移——占4位

    • 即首部长度
    • 指出 TCP 报文段的数据起始处距TCP 报文段的起始处的长度
    • 单位是 32 位字以 4 字节为计算单位
  • 保留——占6位

    • 保留为今后使用目前置为0
  • URG——占1位

    • 紧急URG = 1时表明紧急指针字段有效

    • 告诉系统此报文字段中有紧急数据应尽快传送(相当于高优先级的数据)

  • ACK——占1位

    • ACK = 1时确认号字段有效
    • ACK = 0时确认号字段无效
  • PSH——占1位

    • 推送PSH(PuSH)—— 接收TCP收到PSH = 1的报文段就尽快地交付接收应用进程而不再等到整个缓存都填满了后再向上交付
  • RST——占1位

    • 复位 RST(ReSeT) = 1 时表明TCP连接中出现严重差错如由于主机崩溃或其他原因必须释放连接然后再重新建立运输连接
  • SYN——占1位

    • 同步 SYN = 1表示这是一个连接请求或连接接受报文
  • FIN——占1位

    • 终止 FIN(FINis)—— 用来释放一个连接FIN = 1 表明此报文段的发送端的数据已发送完毕并要求释放运输连接
  • 窗口——占2字节

    • 用来让对方设置发送窗口的依据单位为字节
  • 校验和——占2字节

    • 检验和字段检验的范围包括首部和数据这两部分
  • 紧急指针——占2字节

    • 指出在本报文段中紧急数据共有多少个字节紧急数据放在本报文段数据的最前面
  • 选项

    • TCP 最初只有一种选项即最大报文段长度 MSS (Maximum Segment Size)

    • MSS 告诉对方缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节

    • 数据字段加上 TCP 首部才等于整个的 TCP 报文段

  • 填充字段为了使整个首部长度是4字节的整数倍

2.4. TCP过程

2.4.1. 建立连接

值得注意的是无论确认多少次在逻辑上都没办法确认对方已经和自己建立了可靠的连接如下图的 two-army-problem, 两军悖论

但是我们愿意相信网络的连接不至于糟糕到这样的程度()

因此三次握手被认为是已经足够了

Two-Army-Problem
第一次握手

服务器: 执行最初的 LISTEN 和 ACCEPT被动地开始监听

客户端: 执行最初的CONNECT, 产生一个 SYN = 1 和 ACK = 0 的TCP段代表连接请求

第二次握手

服务器检查是否存在服务进程在监听端口

  • 如果没有进程返回一个 RST = 1 的TCP段
  • 如果存在进程决定拒绝或接受请求
    • 如果接受连接请求发送一个 SYN = 1ACK = 1 的段
第三次握手

客户端发送一个 SYN = 0 和 ACK = 1 的段来确认连接

当服务器收到确认它通知上层应用

2.4.2. 数据传输

停止等待协议 (Stop-and-Wait Protocal)

停止等待协议 最简单但也是最基础的数据链路层协议很多有关协议的基本概念都可以从这个协议中学习到

  • 发送一个段之后暂时地保留一个备份

  • 每个段和ACK必须有ID

  • 重发时间一定大于平均运输时间的两倍 (否则将陷入永无止境的重新发送)

  • 停止和等待协议是一个简单 (但很低效) 的协议

确认丢失和确认迟到

You are late

2.4.3. 可靠的通讯

ARQ (Automatic Repeat reQuest自动重新发送请求)

ARQ 是OSI模型中数据链路层的错误纠正协议之一重新发送的请求是自动发送接受者不需要请求重新发送错误的信息ARQ 包括停止等待 (Stop-and-Wait) 式 ARQ回退n帧go-back-nARQ以及选择性重传selective repeatARQ后两种协议是滑动窗口技术与请求重发技术的结合由于窗口尺寸开到足够大时帧在线路上可以连续地流动因此又称其为连续ARQ协议

TCP使用可变大小的连续ARQ协议 (可变大小的滑动窗口协议)
  • 发送端要发送900字节长的数据划分为9个100字节长的报文段发送窗口确定为500字节

  • 发送端只要收到了对方的确认发送窗口就可前移

  • 发送TCP要维护一个指针每发送一个报文段指针就向前移动一个报文段的距离

  • 发送端已发送了400字节的数据但只收到对前200字节数据的确认同时窗口大小不变

  • 现在发送端还可以发送300字节

一个例子利用可变窗口大小进行流量控制双方确定的窗口值是400

主机A 主机B
SEQ = 1 A现在还能发送300字节
SEQ = 101 A现在还能发送200字节
SEQ = 201 此时发生丢失
允许A再发送300字节 (序号201至500) ACK = 201WIN = 300
SEQ = 301 A还能发送200字节(序号301至500)
SEQ = 401 A还能发送100字节(序号401至500)
SEQ = 201 A超时重发但不能发送序号500以后的数据
允许A再发送100字节(序号501至600) ACK = 501, WIN = 100
SEQ = 501 A已把发送窗口用完(序号501至600)
不允许A再发送(到序号600的数据都已收到) ACK = 601, WIN = 0

2.4.4. TCP释放连接

MSL (Maximum Segment Lifetime) 报文最长存活时间

为什么一定要等2MSL

保证A发送的最后一条确认可以到达B

防止出现任何无效的连接请求段 (在等待2 MSL之后我们可以保证连接上的所有段都已经消失)

2.5. TCP的有限状态机

3.UDP(User Datagram Protocol)

3.1. UDP概述

3.1.1. 为什么使用UDP

  • 不需要建立连接 (建立连接会增加时间延迟)

  • 简单: 尽最大努力交付

    • 面向报文首部开销小

    • 没有拥塞控制: UDP 可以尽可能快的传输无视拥堵

3.1.2. UDP的特点

3.1.3. UDP格式

UDP 报文包括 8个字节的header 和 可变长度的数据部分

4. 应用NAT和PAT

4.1. NAT

4.1.1. 概念

NAT (Network Address Translation, 网络地址转换) 由RFC1631定义指的是在IP包首部用一个地址换另一个地址的过程

实际上NAT 用来允许被分配私有地址的主机访问因特网

不得不再提到 IP地址分配的问题如何解决

  • 保留注册地址

  • 当连接因特网时增加灵活性

4.1.2. NAT类型

  • static NAT (静态NAT): 将内部网络的私有IP地址转换为公有IP地址IP地址对是双射且是一成不变的
  • pooled NAT (NAT池): 映射基于先到先服务动态完成
  • NAPT (Network Address Port Translation, 网络地址端口转换) 或者叫PAT (Port Address Translation, 端口多路复用): 用于允许多个因特网用户分享一个单独的内部全局地址是这三种中最普遍使用的

4.1.3. NAT地址类型

这篇文章讲得非常生动另外一篇文章讲得非常具体

local global 是相对于端口状态说的local是inside部分可以被路由的global是outside部分可以被路由的

Inside Local address (内部本地地址): 内网IP地址

Inside Global address (内部全局地址): 注册IP地址, 对外部展示的内部地址

Outside Global address (外部全局地址): 由主机所有者分配的IP地址通常是注册地址

4.1.4. NAT的优点和缺点

优点因为不是每一个内部主机都需要同一时间访问外部你可以用一小部分全局独一无二的地址来服务相对大量的私有地址的主机

缺点一对一映射如果私有地址空间是a/8但是公共地址是a/24同时只能有254台主机访问因特网

4.2. PAT

4.2.1. PAT如何工作

4.2.2. PAT操作