【Netty】mmap 和 sendFile 零拷贝原理-伙伴云

【Netty】mmap 和 sendFile 零拷贝原理

网友投稿 670 2022-05-28

文章目录

一、零拷贝简介

二、传统 BIO 数据拷贝分析 ( 4拷贝 4切换 )

三、 mmap 内存映射 ( 3拷贝 4切换 )

四、 sendFile 函数 ( Linux 2.1 优化 ) ( 3拷贝2切换 )

五、 sendFile 函数 ( Linux 2.4 优化 ) ( 2拷贝 2切换 )

一、零拷贝简介

零拷贝作用 : 在网络编程中 , 如果要进行性能优化 , 肯定要涉及到零拷贝 ,

使用零拷贝能极大的提升数据传输性能 ;

零拷贝类型 : mmap ( 内存映射 ) 和 sendFile;

数据角度分析 : 在零拷贝机制中 , 整个数据在内存中只有一份数据 , 非零拷贝机制中 , 内核缓冲区 , 用户缓冲区 , Socket 缓冲区 , 各有一份数据 ;

零拷贝指的是没有 CPU 拷贝 , 都是 DMA ( 直接内存访问 ) 拷贝 ;

零拷贝性能优势 : 没有复制数据带来的内存开销 , 没有 CPU 拷贝 , 直接节省了大量 CPU 计算资源 ;

二、传统 BIO 数据拷贝分析 ( 4拷贝 4切换 )

传统 BIO 数据拷贝代码示例 :

package kim.hsl.nio.zerocopy; import java.io.FileInputStream; import java.io.IOException; import java.net.Inet4Address; import java.net.InetSocketAddress; import java.net.Socket; public class BIOClientDemo { public static void main(String[] args) { try { // 客户端与服务器端连接过程忽略, 主要是分析数据拷贝过程 Socket socket = new Socket(); InetSocketAddress inetSocketAddress = new InetSocketAddress(Inet4Address.getLocalHost(), 8888); socket.connect(inetSocketAddress); // 分析下面过程中, 数据拷贝次数, 和用户态与内核态的转换次数 // 1. 从文件中读取数据 FileInputStream fileInputStream = new FileInputStream("file.txt"); byte[] buffer = new byte[1024]; // 首先将硬盘中的文件, 进行 DMA 拷贝, 此处对应 read 方法, // 将文件数据从硬盘中拷贝到内核缓冲区 ( 用户态切换成内核态 ) // 将内核缓冲区中的数据, 通过 CPU 拷贝方式, 拷贝到用户缓冲区 ( 内核态切换成用户态 ) int readLen = fileInputStream.read(buffer); // 2. 写出数据到服务器 // 将用户缓冲区中的数据, 再次通过 CPU 拷贝方式, 拷贝到 Socket 缓冲区 ( 用户态切换成内核态 ) // 再次使用 DMA 拷贝, 将 Socket 缓冲区中的数据拷贝到协议栈 ( Protocol Engine ) 中 socket.getOutputStream().write(buffer, 0, readLen); } catch (IOException e) { e.printStackTrace(); } } }

【Netty】mmap 和 sendFile 零拷贝原理

分析上述代码中数据拷贝次数 , 用户态与内核态状态切换 ;

1 .

fileInputStream.read(buffer)

操作数据拷贝及状态转换分析 :

① 硬盘 ( 初始用户态 ) -> 内核缓冲区 ( 内核态 ) : 首先将硬盘中的文件 , 进行

DMA [ 1 ] ^{[1]} [1] 拷贝

, 此处对应 read 方法 , 将文件数据从硬盘中拷贝到内核缓冲区 ; ( 用户态切换成内核态 )

② 内核缓冲区 ( 内核态 ) -> 用户缓冲区 ( 用户态 ) : 将内核缓冲区中的数据 , 通过

CPU 拷贝

方式 , 拷贝到用户缓冲区 ; ( 内核态切换成用户态 )

2 .

socket.getOutputStream().write(buffer, 0, readLen)

操作数据拷贝及状态转换分析 :

① 用户缓冲区 ( 用户态 ) -> Socket 缓冲区 ( 内核态 ) : 将用户缓冲区中的数据 , 再次通过

CPU 拷贝

方式 , 拷贝到 Socket 缓冲区 ; ( 用户态切换成内核态 )

② Socket 缓冲区 ( 内核态 ) -> 协议栈 : 再次使用

DMA [ 1 ] ^{[1]} [1] 拷贝

, 将 Socket 缓冲区中的数据拷贝到协议栈 ( Protocol Engine ) 中 ;

3 . 总结 : 上述进行了 4 4 4 次拷贝 , 3 3 3 次用户态与内核态之间的状态切换 , 代价很高 ;

① 拷贝次数分析 : 开始时数据存储在硬盘文件中 ,

直接内存拷贝 ( Direct Memory Access )

到内核缓冲区 ,

CPU 拷贝

到用户缓冲区 ,

CPU 拷贝

到 Socket 缓冲区 ,

直接内存拷贝 ( Direct Memory Access )

到协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> 用户缓冲区 ( 用户空间 ) -> Socket 缓冲区 ( 内核空间 ) -> 协议栈

② 状态改变分析 : 开始运行的是用户应用程序 ,

起始状态肯定是用户态

, 之后将硬盘文件数据拷贝到内核缓冲区后 ,

转为内核态

, 之后又拷贝到了用户缓冲区 ,

转为用户态

; 数据写出到 Socket 缓冲区 ,

又转为内核态 ,

最后再切换成用户态 , 执行后续应用程序代码逻辑 ;

用户态 -> 内核态 -> 用户态 -> 内核态 -> 用户态

[ 1 ] [1] [1] DMA 全称 ( Direct Memory Access ) ,

直接内存拷贝

该拷贝通过内存完成

, 不涉及 CPU 参与 ;

三、 mmap 内存映射 ( 3拷贝 4切换 )

将硬盘中的文件映射到内核缓冲区 , 用户空间中的应用程序也可以访问该内核缓冲区中的数据 , 使用这种机制 , 原来的 4 4 4 次数据拷贝减少到了 3 3 3 次 ,

1 . mmap 数据拷贝过程 :

① 硬盘文件 -> 内核缓冲区 : 硬盘文件数据 , DMA 拷贝到内核缓冲区中 ,

应用程序可以直接访问该内核缓冲区中的数据 ;

② 内核缓冲区 -> Socket 缓冲区 : 内核缓冲区数据 , 通过 CPU 拷贝到 Socket 缓冲区 ;

③ Socket 缓冲区 -> 协议栈 : Socket 缓冲区数据 , 通过 DMA 拷贝到协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> Socket 缓冲区 ( 内核空间 ) -> 协议栈

2 . mmap 状态切换 : 其状态切换还是 3 3 3 次 ,

由初始状态用户态 , 在拷贝数据到内核缓冲区时 , 切换成内核态 ,

访问该内核缓冲区数据时 , 又切换成用户态 ,

将数据拷贝到 Socket 缓冲区时 , 切换成内核态 ,

最后再切换成用户态 , 执行后续应用程序代码逻辑 ;

用户态 -> 内核态 -> 用户态 -> 内核态 -> 用户态

四、 sendFile 函数 ( Linux 2.1 优化 ) ( 3拷贝2切换 )

sendFile 是 Linux 提供的函数 , 其实现了由

内核缓冲区

直接将数据拷贝到

Socket 缓冲区

, 该操作直接在内核空间完成 , 不经过用户空间 , 没有用户态参与 , 因此

减少了一次用户态切换 ;

此次优化 , 由原来的 4 4 4 次拷贝 , 3 3 3 次状态切换 , 变成 3 3 3 次拷贝 , 2 2 2 次状态切换 ;

1 . sendFile 函数数据拷贝分析 :

① 硬盘文件 -> 内核缓冲区 : 硬盘文件数据 , DMA 拷贝到内核缓冲区中 ;

② 内核缓冲区 -> Socket 缓冲区 : 内核缓冲区数据 , 通过 CPU 拷贝到 Socket 缓冲区 ;

③ Socket 缓冲区 -> 协议栈 : Socket 缓冲区数据 , 通过 DMA 拷贝到协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> Socket 缓冲区 ( 内核空间 ) -> 协议栈

2 . sendFile 函数状态切换分析 : 其状态切换只有 2 2 2 次 ,

由初始状态用户态 , 在拷贝数据到内核缓冲区时 , 切换成内核态 ,

在内核态直接将数据拷贝到 Socket 缓冲区时 , 还是处于内核状态 ,

之后拷贝到协议栈时 , 变成用户状态 ;

用户态 -> 内核态 -> 用户态

五、 sendFile 函数 ( Linux 2.4 优化 ) ( 2拷贝 2切换 )

sendFile 是 Linux 提供的函数 , 其在 Linux 2.4 版本中 , 直接将数据从

内核缓冲区

拷贝到

协议栈

中 ;

此次优化 , 由原来的 4 4 4 次拷贝 , 3 3 3 次状态切换 , 变成 2 2 2 次拷贝 , 2 2 2 次状态切换 ;

1 . sendFile 函数数据拷贝分析 : 全称 DMA 拷贝 , 没有 CPU 拷贝 ;

① 硬盘文件 -> 内核缓冲区 : 硬盘文件数据 , DMA 拷贝到内核缓冲区中 ;

② 内核缓冲区 -> -> 协议栈 : 通过 DMA 拷贝 , 将内核缓冲区中的数据直接拷贝到协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> 协议栈

2 . sendFile 函数状态切换分析 : 其状态切换只有 2 2 2 次 ,

由初始状态用户态 , 在拷贝数据到内核缓冲区时 , 切换成内核态 ,

在内核态直接将数据拷贝到协议栈时 , 变成用户状态 ;

用户态 -> 内核态 -> 用户态

3 . 少量 CPU 拷贝 : 该机制还存在少量的 CPU 拷贝 , 其对性能的消耗忽略不计 ; 这些 CPU 拷贝操作是从

内核缓冲区

中将数据的长度 ( Length ) , 偏移量 ( Offset ) 拷贝到

Socket 缓冲区

;

Linux Socket编程

Netty之JavaNIO编程模型介绍02

670 2022-05-28

【Netty】mmap 和 sendFile 零拷贝原理

ByteBuf--Netty的数据容器

【Netty】反应器 Reactor 模式 ( 单反应器 Reactor 单线程 | 单反应器 Reactor 多线程 )

Netty之JavaNIO编程模型介绍02

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

家居定制平台是什么？

友情链接

【Netty】mmap 和 sendFile 零拷贝原理

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接