在以太网上发送ip数据报的长度为多少时，是否总有必要使用校验和机制

点击联系发帖人 时间：2017-05-30 13:19

ip数据报的格式

Linux程序设计学习笔记----网络编程之网络数据包拆封包与字节顺序大小端 - 推酷
Linux程序设计学习笔记----网络编程之网络数据包拆封包与字节顺序大小端
网络数据包的封包与拆包
将数据从一台计算机通过一定的路径发送到另一台计算机。应用层数据通过协议栈发到网络上时，
每层协议都要加上一个数据首部（header），称为封装（Encapsulation）
，如下图所示：
不同的协议层对数据包有不同的称谓，在传输层叫做段（segment），在网络层叫做数据包（packet），在链路层叫做帧（frame）。数据封装成帧后发到传输介质上，
到达目的主机后每层协议再剥掉相应的首部
，最后将应用层数据交给应用程序处理。
上图对应两台计算机在同一网段中的情况，如果两台计算机在不同的网段中，那么数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器，如下图所示：
其实在链路层之下还有物理层，指的是电信号的传递方式，比如现在以太网通用的网线（双绞线）、早期以太网采用的的同轴电缆（现在主要用于有线电视）、光纤等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器（Hub）是工作在物理层的网络设备，用于双绞线的连接和信号中继（将已衰减的信号再次放大使之传得更远）。
链路层有以太网、令牌环网等标准，链路层负责网卡设备的驱动、帧同步（就是说从网线上检测到什么信号算作新帧的开始）、冲突检测（如果检测到冲突就自动重发）、数据差错校验等工作。交换机是工作在链路层的网络设备，可以在不同的链路层网络之间转发数据帧（比如十兆以太网和百兆以太网之间、以太网和令牌环网之间），由于不同链路层的帧格式不同，交换机要将进来的数据包拆掉链路层首部重新封装之后再转发。
网络层的IP协议是构成Internet的基础。Internet上的主机通过IP地址来标识，Internet上有大量路由器负责根据IP地址选择合适的路径转发数据包，数据包从Internet上的源主机到目的主机往往要经过十多个路由器。路由器是工作在第三层的网络设备，同时兼有交换机的功能，可以在不同的链路层接口之间转发数据包，因此路由器需要将进来的数据包拆掉网络层和链路层两层首部并重新封装。 IP协议不保证传输的可靠性，数据包在传输过程中可能丢失，可靠性可以在上层协议或应用程序中提供支持。
网络层负责点到点（point-to-point ）的传输（这里的“点”指主机或路由器），而传输层负责端到端（end-to-end）的传输（这里的“端”指源主机和目的主机）。传输层可选择TCP或UDP协议。TCP是一种面向连接的、可靠的协议，有点像打电话，双方拿起电话互通身份之后就建立了连接，然后说话就行了，这边说的话那边保证听得到，并且是按说话的顺序听到的，说完话挂机断开连接。也就是说TCP传输的双方需要首先建立连接，之后由TCP协议保证数据收发的可靠性，丢失的数据包自动重发，上层应用程序收到的总是可靠的数据流，通讯之后关闭连接。UDP协议不面向连接，也不保证可靠性，有点像寄信，写好信放到邮筒里，既不能保证信件在邮递过程中不会丢失，也不能保证信件是按顺序寄到目的地的。使用UDP协议的应用程序需要自己完成丢包重发、消息排序等工作。
拆包的协议
目的主机收到数据包后，如何经过各层协议栈最后到达应用程序呢？整个过程如下图所示：
以太网驱动程序首先根据以太网首部中的“ 上层协议 ”字段确定该数据帧的有效载荷（ payload，指除去协议首部之外实际传输的数据）是IP、ARP还是RARP协议的数据报，然后交给相应的协议处理。假如是IP数据报，IP协议再根据IP首部中的“上层协议”字段确定该数据报的有效载荷是TCP、UDP、ICMP还是IGMP，然后交给相应的协议处理。假如是TCP段或UDP段，TCP或UDP协议再根据TCP首部或UDP首部的“ 端口号 ”字段确定应该将应用层数据交给哪个用户进程。IP地址是标识网络中不同主机的地址，而端口号就是同一台主机上标识不同进程的地址， IP地址和端口号合起来标识网络中唯一的进程。
注意，虽然IP、ARP和RARP数据报都需要以太网驱动程序来封装成帧，但是从功能上划分，ARP和RARP属于链路层，IP属于网络层。虽然ICMP、IGMP、TCP、UDP的数据都需要IP协议来封装成数据报，但是从功能上划分，ICMP、IGMP与IP同属于网络层，TCP和UDP属于传输层。
以太网链路层数据帧格式:
IP数据包头:
IP数据报格式如下：
注：需要注意的是网络数据包以大端字节序传输，当然头部也得是大端字节序，也就是说：
The most significant bit&is numbered 0 at the left, and the least significant bit of a 32-bit value is numbered 31 on the right.
The 4 bytes in the 32-bit value are transmitted in the order: bits 0-7 first, then bits 8-15, then 16-23,&and bits 24-31 last. This is called big endian byte ordering , which is the byte ordering required for&all binary integers in the TCP/IP headers as they traverse a network. This is called the& network byte&order . Machines that store binary integers in other formats, such as the
little endian&
format, must&convert the header values into the network byte order before transmitting the data.
IP数据包头数据结构如下:
struct iphdr {
#if defined(__LITTLE_ENDIAN_BITFIELD)
__u8 ihl:4,
version:4;
#elif defined (__BIG_ENDIAN_BITFIELD)
__u8 version:4,
#error &Please fix &asm/byteorder.h&&
__u16 tot_
__u16 frag_
/*The options start here. */
IP协议版本号，长度为4位，IPv4此字段值为4，IPv6此字段值为6
以32位的字为单位，该字段长度为4位，最小值为5，即不带任何选项的IP首部20个字节；最大值为15，所以首部长度最大为60个字节
服务类型（TOS）
长度为8位。此字段包含3位的优先权（现已忽略），4位的服务类型子字段（只能有一位置1）和1位的保留位（必须置0）。4位的服务类型分别为最小延迟（D）、最大吞吐量（T）、最高可靠性（R）、最小费用（F），如下图。
该字段长度为16位，以字节为单位，该字段长度包含IP的头部和数据部分(payload)。IP数据报最大可达65535个字节。
The total length field is required in the IP header since some data links (e.g., Ethernet) pad small&frames to be a minimum length.
when a datagram&is fragmented the total length field of each fragment is changed to be the size of that fragment.
16位标识，用来标识一个IP数据报，每发送一个此值会加1，可用于分片和重新组装成数据报。
3位标志其中第一位不使用，每二位DF（Don’t Fragment），该位如果为1，如果传输的数据报超过最大传输单元，该数据报会被丢弃，并发送一个ICMP差错报文。第三位MF（More Fragment）表示是否有更多的片，该位为1，说明后续有分片。最后一片MF为0。
注：在这里稍微讲一下IP层分片的问题。假设一个IP数据报大于最大传输单元MTU，那么如果设置了分片标志位，将会被分片传输。
每一片都有自己的IP 头部，IP头部中的标识是一样的，但是片偏移不同（以8字节为单位）。除了最后一片，分片要求其他片除去IP头部的大小必须是8字节的整数倍。除了第一片有tcp/udp头部，其他片都没有。分片完成后，每一片独自成为一个数据包（跟数据报概念不同，参见这里），可以走不同的路由，最后到达目的地的时候IP层根据它们各自IP头部的信息重新组成一个IP 数据报。
分片是有风险的，因为一旦某一片丢失，就需要重传这个IP数据报，因为IP层本身并没有超时重传的机制，可靠性需要TCP层来保证（一些UDP协议的可靠性由应用程序保证），一旦一个TCP段中的某一片丢失，TCP协议层会超时重传。此外，分片可以发生在源主机或者中间的路由，如果发生在中间的路由，源主机根本不知道是怎样分片，所以要尽量避免分片。
应用数据的多个IP数据报由TCP层根据seq number 进行重组成原始数据，存放到TCP接收缓冲区。
Using sequence numbers , a receiving TCP discards duplicate segments and&reorders segments that arrive out of order . Recall that any of these anomalies&can happen because TCP uses IP to deliver its segments, and IP does not provide&duplicate elimination or guarantee correct ordering. Because it is a byte stream&protocol, however, TCP never delivers data to the receiving application out of order.&Thus, the receiving TCP may be forced to hold on to data with larger sequence&numbers before giving it to an application until a missing lower-sequence-numbered&segment (a “hole”) is filled in.
TTL（Time To Live）表示数据报最多可经过的路由器的数量。数据报每经过一个路由器，TTL减1，减为0时丢弃，并发送ICMP报文通知源主机。TTL可以避免数据报在路由器之间不断循环。
表示IP层上承载的是哪个高级协议。在封装与分用的过程中，协议栈知道该交给哪个层的协议处理。1 ICMP 2 IGMP 6 TCP 17UDP
头部校验和
保证数据报头部的数据完整性，但校验不包括数据部分。这样做的目的有二：一是所有将数据封装在IP数据包中的高层协议均含有覆盖整个数据的校验和，因此IP数据报没有必要再对其所承载的数据部分进行校验。二是每经过一个路由器，IP数据报的头部要发生改变（如TTL），而数据部分不变，这样只对发生改变的头部进行校验，显然不会浪费太多的时间。为了减少计算时间，一般不用CRC校验码，而是采用更简单的网际校验和（Internet Checksum）。
Since a router often changes only the TTL field (decrementing it by 1), a router&can incrementally update the checksum when it forwards a received datagram, instead of&calculating the checksum over the entire IP header again.
The standard BSD implementation, however, does not use this incremental update feature when forwarding a&datagram.
发送数据的主机IP地址
目的IP地址
接收数据的主机IP地址
选项与填充（选项为4字节整数倍，否则用0填充）
安全和处理限制
路径记录：记录所经历路由器的IP地址
时间戳：记录所经历路由器的IP地址和时间
宽松源站路由：指定数据报文必须经历的IP地址，可以经过没有指定的IP地址。
严格的源站路由：指定数据报文必须经历的IP地址，不能经过没有指定的IP地址。
二、IP地址与路由
IPv4的IP地址长度为4字节，通常采用点分十进制表示法（dotted decimal representation）例如0xc0a80002表示为192.168.0.2。Internet被各种路由器和网关设备分隔成很多网段，为了标识不同的网段，需要把32位的IP地址划分成网络号和主机号两部分，网络号相同的各主机位于同一网段，相互间可以直接通信，网络号不同的主机之间通信则需要通过路由器转发。
In our general scheme, IP can receive a datagram from TCP, UDP, ICMP, or IGMP (that is, a&locally generated datagram) to send, or one that has been received from a network interface (a&datagram to forward). The IP layer has a routing table in memory that it searches each time it&receives a datagram to send. When a datagram is received from a network interface, IP first checks&if the destination IP address is one of its own IP addresses or an IP broadcast address. If so, the&datagram is delivered to the protocol module specified by the protocol field in the IP header. If the&datagram is not destined for this IP layer, then (1) if the IP layer was configured to act as a router&the packet is forwarded (that is, handled as an outgoing datagram as described below), else (2) the&datagram is silently discarded.
假设某主机上的网络接口配置和路由表如下：
这台主机只有一个网络接口连到192.168.232.0/24网络。路由表的Destination是目的网络地址，Genmask是子网掩码，Gateway是下一跳地址，Iface是发送接口，Flags中的U标志表示此条目有效（可以禁用某些条目），G标志表示此条目的下一跳地址是某个路由器的地址，没有G标志的条目表示目的网络地址是与本机接口直接相连的网络，不必经路由器转发，因此下一跳地址处记为*号。
如果要发送的数据包的目的地址是192.168.232.1，跟第三行的子网掩码做与运算得到192.168.232.0，正是第三行的目的网络地址，因此从eth0接口发送出去，由于192.168.232.0/24正是与eth0接口直接相连的网络，因此可以直接发到目的主机，不需要经路由器转发。
如果要发送的数据包的目的地址是202.10.1.2，跟后两行路由表条目都不匹配，那么就要按缺省路由条目，从eth0接口发出去，首先发往192.168.232.2 路由器，再让路由器根据它的路由表决定下一跳地址。
A complete matching host address is searched for before a matching network ID. Only if both of&these fail is a default route used.
路由的处理过程如下，ARP部分可以参考这里：
TCP 数据包头
TCP数据包结构
数据结构如下:
struct tcphdr {
// &span style=&font-family:SimS&&源端口号&/span&
// 目的端口号
// 封装序号
__be32 ack_
&span style=&font-family:SimS&&// ACK序号&/span&
#if defined(__LITTLE_ENDIAN_BITFIELD)
__u16 res1:4,
// 传输结束
&span style=&font-family:SimS&&// 建立同步&/span&
// 对端复位
// 尽快传递给应用程序
&span style=&font-family:SimS&&// 确认数据包&/span&
// 紧急数据包
#elif defined(__BIG_ENDIAN_BITFIELD) &span style=&font-family:SimS&&// 大端时&/span&
__u16 doff:4,
#error &Adjust your &asm/byteorder.h& defines&
//&span style=&font-family:SimS&& 滑动端口大小&/span&
__be16 urg_
// 紧急信息
1-1.源始端口16位，范围当然是0-65535啦。
1-2.目的端口，同上。
2-1.数据序号32位，TCP为发送的每个字节都编一个号码，这里存储当前数据包数据第一个字节的序号。
3-1.确认序号32位，为了安全，TCP告诉接受者希望他下次接到数据包的第一个字节的序号。
4-1.偏移4位，类似IP，表明数据距包头有多少个32位。
4-2.保留6位，未使用，应置零。
4-3.紧急比特URG—当URG＝1时，表明紧急指针字段有效。它告诉系统此报文段中有紧急数据，应尽快传送(相当于高优先级的数据)。
4-3.确认比特ACK—只有当ACK＝1时确认号字段才有效。当ACK＝0时，确认号无效。
参考TCP三次握手
4-4.复位比特RST(Reset) —当RST＝1时，表明TCP连接中出现严重差错（如由于主机崩溃或其他原因），必须释放连接，然后再重新
建立运输连接。
参考TCP三次握手
4-5.同步比特SYN—同步比特SYN置为1，就表示这是一个连接请求或连接接受报文。
参考TCP三次握手
4-6.终止比特FIN(FINal)—用来释放一个连接。当FIN＝1时，表明此报文段的发送端的数据已发送完毕，并要求释放运输连接。
4-7.窗口字段16位，窗口字段用来控制对方发送的数据量，单位为字节。TCP连接的一端根据设置的缓存空间大小确定自己的接收窗口
大小，然后通知对方以确定对方的发送窗口的上限。
5-1.包校验和16位，包括
这两部分。在计算检验和时，要在TCP报文段的前面加上12字节的伪首部。
5-2.紧急指针16位，紧急指针指出在本报文段中的紧急数据的最后一个字节的序号。
6-1.可选选项24位，类似IP，是可选选项。
6-2.填充8位，使选项凑足32位。
7-1.用户数据……
可以看出，每个IP包至少要20字节的头部长度，这些与下载内容无关，加上目前多数传输，包括http协议（就是IE直接下载），都是基于
TCP协议的，所以IP包裹还要从用户数据中扣除20字节的TCP包头，这里已经是40字节，加上其他程序的连接，状态确认等等包裹，因
而算出来要比理论值要小。
UDP数据包头
UDP协议（User Datagram Protocol）是传输层协议，为应用层提供服务，RFC768中有基本的UDP描述。UDP的长度是8字节，其数据包头的结构如图所示。UDP数据包是包含在一个IP数据报文中的。
UDP协议是面向非连接的，任何一方创建好后，都可以向对方发送数据包，甚至可以在对方未开机或不存在的情况下，一方仍然可以成功地发送数据包.
字节顺序与大小端问题
什么是大端和小端
Big-Endian和Little-Endian的定义如下：
1) Little-Endian就是低位字节排放在内存的低地址端，高位字节排放在内存的高地址端。
2) Big-Endian就是高位字节排放在内存的低地址端，低位字节排放在内存的高地址端。
举一个例子，比如数字0x12 34 56 78在内存中的表示形式为：
1)大端模式：
低地址 -----------------& 高地址
0x12 &| &0x34 &| &0x56 &| &0x78
2)小端模式：
低地址 ------------------& 高地址
0x78 &| &0x56 &| &0x34 &| &0x12
可见，大端模式和字符串的存储模式类似。
3)下面是两个具体例子：
16bit宽的数0x1234在Little-endian模式（以及Big-endian模式）CPU内存中的存放方式（假设从地址0x4000开始存放）为：
小端模式存放内容
大端模式存放内容
32bit宽的数0x在Little-endian模式以及Big-endian模式）CPU内存中的存放方式（假设从地址0x4000开始存放）为：
小端模式存放内容
大端模式存放内容
&4)大端小端没有谁优谁劣，各自优势便是对方劣势：
小端模式：强制转换数据不需要调整字节内容，1、2、4字节的存储方式一样。
大端模式：符号位的判定固定为第一个字节，容易判断正负。
数组在大端小端情况下的存储：
以unsigned int value = 0x为例，分别看看在两种字节序下其存储情况，我们可以用unsigned char buf[4]来表示value：
Big-Endian: 低地址存放高位，如下：
---------------
buf[3] (0x78) -- 低位
buf[2] (0x56)
buf[1] (0x34)
buf[0] (0x12) -- 高位
---------------
Little-Endian: 低地址存放低位，如下：
---------------
buf[3] (0x12) -- 高位
buf[2] (0x34)
buf[1] (0x56)
buf[0] (0x78) -- 低位
--------------
为什么会有大小端模式之分呢？
这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。例如一个16bit的short型x，在内存中的地址为0x0010，x的值为0x1122，那么0x11为高字节，0x22为低字节。对于大端模式，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，刚好相反。我们常用的X86结构是小端模式,网络字节顺序采用大端模式,
如何检测大小端:
联合体union的存放顺序是所有成员都从低地址开始存放，利用该特性可以轻松地获得了CPU对内存采用Little-endian还是Big-endian模式读写：
#include &stdio.h&
#include &stdlib.h&
union word
int checkCPU(void)
printf(&c.b=%d\n&,c.b);
return (c.b==1);
int main(void)
i= checkCPU();
printf(&this is Big_endian\n&);
else if(i==1)
printf(&this is Little_endian\n&);
如在小端的时候,c.b为1,大端的时候为0.
字节顺序转换函数
既然网络上传输的数据以及各种类型的主机字节顺序有差异,因此X86平台下编译网络程序的时候,要注意大小端转换.比如在绑定socket和ip地址的时候之一使用网络顺序.
函数可以实现字节顺序与主机字节顺序转换.
具体函数的使用使用的搜搜用法就好了.
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置：公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致ARP协议也是发出一个数据包（包含在以太网数据包中） - 兰亭风雨的专栏
- 博客频道 - CSDN.NET
ARP协议也是发出一个数据包（包含在以太网数据包中）
上图中，1号计算机向2号计算机发送一个数据包，同一个子网络的3号、4号、5号计算机都会收到这个包。它们读取这个包的&标头&，找到接收方的MAC地址，然后与自身的MAC地址相比较，如果两者相同，就接受这个包，做进一步处理，否则就丢弃这个包。这种发送方式就叫做&广播&（broadcasting）。 4.2 IP协议根据IP协议发送的数据，就叫做IP数据包。不难想象，其中必定包括IP地址信息。规定网络地址的协议，叫做IP协议。它所定义的地址，就被称为IP地址。 3.1 定义如何分层有不同的模型，有的模型分七层，有的分四层。我觉得，把互联网分成五层，比较容易解释。应用程序收到&传输层&的数据，接下来就要进行解读。由于互联网是开放架构，数据来源五花八门，必须事先规定好格式，否则根本无法解读。全世界几十亿台电脑，连接在一起，两两通信。上海的某一块网卡送出信号，洛杉矶的另一块网卡居然就收到了，两者实际上根本不知道对方的物理位置，你不觉得这是很神奇的事情吗？那么，怎样才能从IP地址，判断两台计算机是否属于同一个子网络呢？这就要用到另一个参数&子网掩码&（subnet mask）。总结一下，IP协议的作用主要有两个，一个是为每一台计算机分配IP地址，另一个是确定哪些地址在同一个子网络。
所以，我们需要一种机制，能够从IP地址得到MAC地址。 UDP协议的优点是比较简单，容易实现，但是缺点是可靠性较差，一旦数据包发出，无法知道对方是否收到。 3.4 广播 ================================================= &应用层&的作用，就是规定应用程序的数据格式。这里又可以分成两种情况。第一种情况，如果两台主机不在同一个子网络，那么事实上没有办法得到对方的MAC地址，只能把数据包传送到两个子网络连接处的&网关&（gateway），让网关去处理。
回答是不需要，我们可以把IP数据包直接放进以太网数据包的&数据&部分，因此完全不用修改以太网的规格。这就是互联网分层结构的好处：上层的变动完全不涉及下层的结构。作者：阮一峰也就是说，我们还需要一个参数，表示这个数据包到底供哪个程序（进程）使用。这个参数就叫做&端口&（port），它其实是每一个使用网卡的程序的编号。每个数据包都发到主机的特定端口，所以不同的程序就能取到自己所需要的数据。我们从最底下的一层开始。
互联网的每一层，都定义了很多协议。这些协议的总称，就叫做&互联网协议&（Internet Protocol Suite）。它们是互联网的核心，下面介绍每一层的功能，主要就是介绍每一层的主要协议。 &标头&的长度，固定为18字节。&数据&的长度，最短为46字节，最长为1500字节。因此，整个&帧&最短为64字节，最长为1518字节。如果数据很长，就必须分割成多个帧进行发送。 4.1 网络层的由来有了数据包的定义、网卡的MAC地址、广播的发送方式，&链接层&就可以在多台计算机之间传送数据了。但是，问题在于单单从IP地址，我们无法判断网络部分。还是以172.16.254.1为例，它的网络部分，到底是前24位，还是前16位，甚至前28位，从IP地址上是看不出来的。这是最高的一层，直接面对用户。它的数据就放在TCP数据包的&数据&部分。因此，现在的以太网的数据包就变成下面这样。知道&子网掩码&，我们就能判断，任意两个IP地址是否处在同一个子网络。方法是将两个IP地址与子网掩码分别进行AND运算（两个数位都为1，运算结果为1，否则为0），然后比较结果是否相同，如果是的话，就表明它们在同一个子网络中，否则就不是。以太网协议，依靠MAC地址发送数据。理论上，单单依靠MAC地址，上海的网卡就可以找到洛杉矶的网卡了，技术上是可以实现的。上面提到，以太网数据包的&标头&，包含了发送者和接受者的信息。那么，发送者和接受者是如何标识呢？于是，&网络层&出现以后，每台计算机有了两种地址，一种是MAC地址，另一种是网络地址。两种地址之间没有任何联系，MAC地址是绑定在网卡上的，网络地址则是管理员分配的，它们只是随机组合在一起。
接下来的问题是，同一台主机上有许多程序都需要用到网络，比如，你一边浏览网页，一边与朋友在线聊天。当一个数据包从互联网上发来的时候，你怎么知道，它是表示网页的内容，还是表示在线聊天的内容？因此，必须找到一种方法，能够区分哪些MAC地址属于同一个子网络，哪些不是。如果是同一个子网络，就采用广播方式发送，否则就采用&路由&方式发送。（&路由&的意思，就是指如何向不同的子网络分发数据包，这是一个很大的主题，本文不涉及。）遗憾的是，MAC地址本身无法做到这一点。它只与厂商有关，与所处网络无关。 &标头&部分主要包括版本、长度、IP地址等信息，&数据&部分则是IP数据包的具体内容。它放进以太网数据包后，以太网数据包就变成了下面这样。互联网是无数子网络共同组成的一个巨型网络，很像想象上海和洛杉矶的电脑会在同一个子网络，这几乎是不可能的。具体来说，IP数据包也分为&标头&和&数据&两个部分。每块网卡出厂的时候，都有一个全世界独一无二的MAC地址，长度是48个二进制位，通常用12个十六进制数表示。
&传输层&的功能，就是建立&端口到端口&的通信。相比之下，&网络层&的功能是建立&主机到主机&的通信。只要确定主机和端口，我们就能实现程序之间的交流。因此，Unix系统就把主机+端口，叫做&套接字&（socket）。有了它，就可以进行网络应用程序开发了。 4.3 IP数据包 &端口&是0到65535之间的一个整数，正好16个二进制位。0到1023的端口被系统占用，用户只能选用大于1023的端口。不管是浏览网页还是在线聊天，应用程序会随机选用一个端口，然后与服务器的相应端口联系。 3.2 以太网协议所谓&子网掩码&，就是表示子网络特征的一个参数。它在形式上等同于IP地址，也是一个32位二进制数字，它的网络部分全部为1，主机部分全部为0。比如，IP地址172.16.254.1，如果已知网络部分是前24位，主机部分是后8位，那么子网络掩码就是11.，写成十进制就是255.255.255.0。早期的时候，每家公司都有自己的电信号分组方式。逐渐地，一种叫做&以太网&（Ethernet）的协议，占据了主导地位。它们叫什么名字，其实并不重要。只需要知道，互联网分成若干层就可以了。 &标头&包含数据包的一些说明项，比如发送者、接受者、数据类型等等；&数据&则是数据包的具体内容。互联网上的每一台计算机，都会分配到一个IP地址。这个地址分成两个部分，前一部分代表网络，后一部分代表主机。比如，IP地址172.16.254.1，这是一个32位的地址，假定它的网络部分是前24位（172.16.254），那么主机部分就是后8位（最后的那个1）。处于同一个子网络的电脑，它们IP地址的网络部分必定是相同的，也就是说172.16.254.2应该与172.16.254.1处在同一个子网络。有了MAC地址和IP地址，我们已经可以在互联网上任意两台主机上建立通信。举例来说，TCP协议可以为各种各样的程序传递数据，比如Email、WWW、FTP等等。那么，必须有不同协议规定电子邮件、网页、FTP数据的格式，这些应用程序协议就构成了&应用层&。电脑要组网，第一件事要干什么？当然是先把电脑连起来，可以用光缆、电缆、双绞线、无线电波等方式。五、传输层二、实体层总之，有了ARP协议之后，我们就可以得到同一个子网络内的主机MAC地址，可以把数据包发送到任意一台主机之上了。第二种情况，如果两台主机在同一个子网络，那么我们可以用ARP协议，得到对方的MAC地址。ARP协议也是发出一个数据包（包含在以太网数据包中），其中包含它所要查询主机的IP地址，在对方的MAC地址这一栏，填的是FF:FF:FF:FF:FF:FF，表示这是一个&广播&地址。它所在子网络的每一台主机，都会收到这个数据包，从中取出IP地址，与自身的IP地址进行比较。如果两者相同，都做出回复，向对方报告自己的MAC地址，否则就丢弃这个包。
但是前面说过，以太网数据包只包含MAC地址，并没有IP地址的栏位。那么是否需要修改数据定义，再添加一个栏位呢？互联网协议入门一、概述用户接触到的，只是最上面的一层，根本没有感觉到下面的层。要理解互联网，必须从最下层开始，自下而上理解每一层的功能。 3.3 MAC地址
为了解决这个问题，提高网络可靠性，TCP协议就诞生了。这个协议非常复杂，但可以近似认为，它就是有确认机制的UDP协议，每发出一个数据包都要求确认。如果有一个数据包遗失，就收不到确认，发出方就知道有必要重发这个数据包了。至此，整个互联网的五层结构，自下而上全部讲完了。这是从系统的角度，解释互联网是如何构成的。下一篇，我反过来，从用户的角度，自上而下看看这个结构是如何发挥作用，完成一次网络数据交换的。（完）如上图所示，最底下的一层叫做&实体层&（Physical Layer），最上面的一层叫做&应用层&（Application Layer），中间的三层（自下而上）分别是&链接层&（Link Layer）、&网络层&（Network Layer）和&传输层&（Transport Layer）。越下面的层，越靠近硬件；越上面的层，越靠近用户。
现在，我们必须在数据包中加入端口信息，这就需要新的协议。最简单的实现叫做UDP协议，它的格式几乎就是在数据前面，加上端口号。关于&网络层&，还有最后一点需要说明。 5.3 TCP协议但是，这样做有一个重大的缺点。以太网采用广播方式发送数据包，所有成员人手一&包&，不仅效率低，而且局限在发送者所在的子网络。也就是说，如果两台计算机不在同一个子网络，广播是传不过去的。这种设计是合理的，否则互联网上每一台计算机都会收到所有包，那会引起灾难。网络地址帮助我们确定计算机所在的子网络，MAC地址则将数据包送到该子网络中的目标网卡。因此，从逻辑上可以推断，必定是先处理网络地址，然后再处理MAC地址。以太网规定，一组电信号构成一个数据包，叫做&帧&（Frame）。每一帧分成两个部分：标头（Head）和数据（Data）。这就导致了&网络层&的诞生。它的作用是引进一套新的地址，使得我们能够区分不同的计算机是否属于同一个子网络。这套地址就叫做&网络地址&，简称&网址&。原文地址：六、应用层目前，广泛采用的是IP协议第四版，简称IPv4。这个版本规定，网络地址由32个二进制位组成。 &标头&部分主要定义了发出端口和接收端口，&数据&部分就是具体的内容。然后，把整个UDP数据包放入IP数据包的&数据&部分，而前面说过，IP数据包又是放在以太网数据包之中的，所以整个以太网数据包现在变成了下面这样：其次，就算有了MAC地址，系统怎样才能把数据包准确送到接收方？
IP数据包的&标头&部分的长度为20到60字节，整个数据包的总长度最大为65,535字节。因此，理论上，一个IP数据包的&数据&部分，最长为65,515字节。前面说过，以太网数据包的&数据&部分，最长只有1500字节。因此，如果IP数据包超过了1500字节，它就需要分割成几个以太网数据包，分开发送了。回答是以太网采用了一种很&原始&的方式，它不是把数据包准确送到接收方，而是向本网络内所有计算机发送，让每台计算机自己判断，是否为接收方。 5.2 UDP协议
定义地址只是第一步，后面还有更多的步骤。
我们每天使用互联网，你是否想过，它是如何实现的？习惯上，我们用分成四段的十进制数表示IP地址，从0.0.0.0一直到255.255.255.255。互联网的核心是一系列协议，总称为&互联网协议&（Internet Protocol Suite）。它们对电脑如何连接和组网，做出了详尽的规定。理解了这些协议，就理解了互联网的原理。这就是&链接层&的功能，它在&实体层&的上方，确定了0和1的分组方式。 UDP数据包，也是由&标头&和&数据&两部分组成。 5.1 传输层的由来单纯的0和1没有任何意义，必须规定解读方式：多少个电信号算一组？每个信号位有何意义？比如，已知IP地址172.16.254.1和172.16.254.233的子网掩码都是255.255.255.0，请问它们是否在同一个子网络？两者与子网掩码分别进行AND运算，结果都是172.16.254.0，因此它们在同一个子网络。前6个十六进制数是厂商编号，后6个是该厂商的网卡流水号。有了MAC地址，就可以定位网卡和数据包的路径了。 TCP数据包和UDP数据包一样，都是内嵌在IP数据包的&数据&部分。TCP数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常TCP数据包的长度不会超过IP数据包的长度，以确保单个TCP数据包不必再分割。互联网的实现，分成好几层。每一层都有自己的功能，就像建筑物一样，每一层都靠下一层支持。下面就是我的学习笔记。因为这些协议实在太复杂、太庞大，我想整理一个简洁的框架，帮助自己从总体上把握它们。为了保证简单易懂，我做了大量的简化，有些地方并不全面和精确，但是应该能够说清楚互联网的原理。
四、网络层因为IP数据包是放在以太网数据包里发送的，所以我们必须同时知道两个地址，一个是对方的MAC地址，另一个是对方的IP地址。通常情况下，对方的IP地址是已知的（后文会解释），但是我们不知道它的MAC地址。每一层都是为了完成一种功能。为了实现这些功能，就需要大家都遵守共同的规则。回答是有一种ARP协议，可以解决这个问题。这个留到后面介绍，这里只需要知道，以太网数据包必须知道接收方的MAC地址，然后才能发送。 1.1 五层模型大家都遵守的规则，就叫做&协议&（protocol）。 1.2 层与协议首先，一块网卡怎么会知道另一块网卡的MAC地址？这就叫做&实体层&，它就是把电脑连接起来的物理手段。它主要规定了网络的一些电气特性，作用是负责传送0和1的电信号。 UDP数据包非常简单，&标头&部分一共只有8个字节，总长度不超过65,535字节，正好放进一个IP数据包。以太网规定，连入网络的所有设备，都必须具有&网卡&接口。数据包必须是从一块网卡，传送到另一块网卡。网卡的地址，就是数据包的发送地址和接收地址，这叫做MAC地址。因此，TCP协议能够确保数据不会遗失。它的缺点是过程复杂、实现困难、消耗较多的资源。
本文章已收录于：}

常信村百科网