【Netty】mmap 和 sendFile 零拷贝原理

【Netty】mmap 和 sendFile 零拷贝原理一、零拷贝简介、二、传统BIO数据拷贝分析(4拷贝4切换)、三、mmap内存映射(3拷贝4切换)、四、sendFile函数(Linux2.1优化)(3拷贝2切换)、五、sendFile函数(Linux2.4优化)(2拷贝2切换)、

大家好,又见面了,我是你们的朋友全栈君。

一、 零拷贝 简介


零拷贝作用 : 在网络编程中 , 如果要进行性能优化 , 肯定要涉及到零拷贝 , 使用零拷贝能极大的提升数据传输性能 ;

零拷贝类型 : mmap ( 内存映射 ) 和 sendFile;

数据角度分析 : 在零拷贝机制中 , 整个数据在内存中只有一份数据 , 非零拷贝机制中 , 内核缓冲区 , 用户缓冲区 , Socket 缓冲区 , 各有一份数据 ;

零拷贝指的是没有 CPU 拷贝 , 都是 DMA ( 直接内存访问 ) 拷贝 ;

零拷贝性能优势 : 没有复制数据带来的内存开销 , 没有 CPU 拷贝 , 直接节省了大量 CPU 计算资源 ;

二、 传统 BIO 数据拷贝分析 ( 4拷贝 4切换 )


传统 BIO 数据拷贝代码示例 :

package kim.hsl.nio.zerocopy;

import java.io.FileInputStream;
import java.io.IOException;
import java.net.Inet4Address;
import java.net.InetSocketAddress;
import java.net.Socket;

public class BIOClientDemo { 
   
    public static void main(String[] args) { 
   
        try { 
   
            // 客户端与服务器端连接过程忽略, 主要是分析数据拷贝过程
            Socket socket = new Socket();
            InetSocketAddress inetSocketAddress =
                    new InetSocketAddress(Inet4Address.getLocalHost(), 8888);
            socket.connect(inetSocketAddress);

            // 分析下面过程中, 数据拷贝次数, 和用户态与内核态的转换次数

            // 1. 从文件中读取数据
            FileInputStream fileInputStream = new FileInputStream("file.txt");
            byte[] buffer = new byte[1024];

            // 首先将硬盘中的文件, 进行 DMA 拷贝, 此处对应 read 方法, 
            // 将文件数据从硬盘中拷贝到 内核缓冲区 ( 用户态切换成内核态 )
            // 将内核缓冲区中的数据, 通过 CPU 拷贝 方式, 拷贝到 用户缓冲区 ( 内核态切换成用户态 )
            int readLen = fileInputStream.read(buffer);

            // 2. 写出数据到服务器
            // 将用户缓冲区中的数据, 再次通过 CPU 拷贝方式, 拷贝到 Socket 缓冲区 ( 用户态切换成内核态 )
            // 再次使用 DMA 拷贝, 将 Socket 缓冲区中的数据拷贝到 协议栈 ( Protocol Engine ) 中
            socket.getOutputStream().write(buffer, 0, readLen);
        } catch (IOException e) { 
   
            e.printStackTrace();
        }
    }
}

分析上述代码中数据拷贝次数 , 用户态与内核态状态切换 ;

1 . fileInputStream.read(buffer) 操作数据拷贝及状态转换分析 :

① 硬盘 ( 初始用户态 ) -> 内核缓冲区 ( 内核态 ) : 首先将硬盘中的文件 , 进行 DMA [ 1 ] ^{[1]} [1] 拷贝 , 此处对应 read 方法 , 将文件数据从硬盘中拷贝到 内核缓冲区 ; ( 用户态切换成内核态 )

② 内核缓冲区 ( 内核态 ) -> 用户缓冲区 ( 用户态 ) : 将内核缓冲区中的数据 , 通过 CPU 拷贝 方式 , 拷贝到 用户缓冲区 ; ( 内核态切换成用户态 )

2 . socket.getOutputStream().write(buffer, 0, readLen) 操作数据拷贝及状态转换分析 :

① 用户缓冲区 ( 用户态 ) -> Socket 缓冲区 ( 内核态 ) : 将用户缓冲区中的数据 , 再次通过 CPU 拷贝 方式 , 拷贝到 Socket 缓冲区 ; ( 用户态切换成内核态 )

② Socket 缓冲区 ( 内核态 ) -> 协议栈 : 再次使用 DMA [ 1 ] ^{[1]} [1] 拷贝 , 将 Socket 缓冲区中的数据拷贝到 协议栈 ( Protocol Engine ) 中 ;

3 . 总结 : 上述进行了 4 4 4 次拷贝 , 3 3 3 次用户态与内核态之间的状态切换 , 代价很高 ;

① 拷贝次数分析 : 开始时数据存储在 硬盘文件 中 , 直接内存拷贝 ( Direct Memory Access )内核缓冲区 , CPU 拷贝用户缓冲区 , CPU 拷贝Socket 缓冲区 , 直接内存拷贝 ( Direct Memory Access )协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> 用户缓冲区 ( 用户空间 ) -> Socket 缓冲区 ( 内核空间 ) -> 协议栈

② 状态改变分析 : 开始运行的是用户应用程序 , 起始状态肯定是用户态 , 之后将硬盘文件数据拷贝到内核缓冲区后 , 转为内核态 , 之后又拷贝到了用户缓冲区 , 转为用户态 ; 数据写出到 Socket 缓冲区 , 又转为内核态 , 最后再切换成用户态 , 执行后续应用程序代码逻辑 ;

用户态 -> 内核态 -> 用户态 -> 内核态 -> 用户态

[ 1 ] [1] [1] DMA 全称 ( Direct Memory Access ) , 直接内存拷贝 , 该拷贝通过内存完成 , 不涉及 CPU 参与 ;

三、 mmap 内存映射 ( 3拷贝 4切换 )


将硬盘中的文件映射到 内核缓冲区 , 用户空间中的应用程序也可以访问该 内核缓冲区 中的数据 , 使用这种机制 , 原来的 4 4 4 次数据拷贝减少到了 3 3 3 次 ,

1 . mmap 数据拷贝过程 :

① 硬盘文件 -> 内核缓冲区 : 硬盘文件数据 , DMA 拷贝到 内核缓冲区 中 , 应用程序可以直接访问该 内核缓冲区中的数据 ;

② 内核缓冲区 -> Socket 缓冲区 : 内核缓冲区 数据 , 通过 CPU 拷贝到 Socket 缓冲区 ;

③ Socket 缓冲区 -> 协议栈 : Socket 缓冲区 数据 , 通过 DMA 拷贝到 协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> Socket 缓冲区 ( 内核空间 ) -> 协议栈

2 . mmap 状态切换 : 其状态切换还是 3 3 3 , 由初始状态 用户态 , 在拷贝数据到内核缓冲区时 , 切换成内核态 , 访问该内核缓冲区数据时 , 又切换成用户态 , 将数据拷贝到 Socket 缓冲区时 , 切换成内核态 , 最后再切换成用户态 , 执行后续应用程序代码逻辑 ;

用户态 -> 内核态 -> 用户态 -> 内核态 -> 用户态

四、 sendFile 函数 ( Linux 2.1 优化 ) ( 3拷贝2切换 )


sendFile 是 Linux 提供的函数 , 其实现了由 内核缓冲区 直接将数据拷贝到 Socket 缓冲区 , 该操作直接在内核空间完成 , 不经过用户空间 , 没有用户态参与 , 因此 减少了一次用户态切换 ;

此次优化 , 由原来的 4 4 4 次拷贝 , 3 3 3 次状态切换 , 变成 3 3 3 次拷贝 , 2 2 2 次状态切换 ;

1 . sendFile 函数 数据拷贝分析 :

① 硬盘文件 -> 内核缓冲区 : 硬盘文件数据 , DMA 拷贝到 内核缓冲区 中 ;

② 内核缓冲区 -> Socket 缓冲区 : 内核缓冲区 数据 , 通过 CPU 拷贝到 Socket 缓冲区 ;

③ Socket 缓冲区 -> 协议栈 : Socket 缓冲区 数据 , 通过 DMA 拷贝到 协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> Socket 缓冲区 ( 内核空间 ) -> 协议栈

2 . sendFile 函数 状态切换分析 : 其状态切换只有 2 2 2 , 由初始状态 用户态 , 在拷贝数据到内核缓冲区时 , 切换成内核态 , 在内核态直接将数据拷贝到 Socket 缓冲区时 , 还是处于内核状态 , 之后拷贝到协议栈时 , 变成用户状态 ;

用户态 -> 内核态 -> 用户态

五、 sendFile 函数 ( Linux 2.4 优化 ) ( 2拷贝 2切换 )


sendFile 是 Linux 提供的函数 , 其在 Linux 2.4 版本中 , 直接将数据从 内核缓冲区 拷贝到 协议栈 中 ;

此次优化 , 由原来的 4 4 4 次拷贝 , 3 3 3 次状态切换 , 变成 2 2 2 次拷贝 , 2 2 2 次状态切换 ;

1 . sendFile 函数 数据拷贝分析 : 全称 DMA 拷贝 , 没有 CPU 拷贝 ;

① 硬盘文件 -> 内核缓冲区 : 硬盘文件数据 , DMA 拷贝到 内核缓冲区 中 ;

② 内核缓冲区 -> -> 协议栈 : 通过 DMA 拷贝 , 将 内核缓冲区 中的数据直接拷贝到 协议栈 ;

硬盘文件 -> 内核缓冲区 ( 内核空间 ) -> 协议栈

2 . sendFile 函数 状态切换分析 : 其状态切换只有 2 2 2 , 由初始状态 用户态 , 在拷贝数据到内核缓冲区时 , 切换成内核态 , 在内核态直接将数据拷贝到协议栈时 , 变成用户状态 ;

用户态 -> 内核态 -> 用户态

3 . 少量 CPU 拷贝 : 该机制还存在少量的 CPU 拷贝 , 其 对性能的消耗忽略不计 ; 这些 CPU 拷贝操作是从 内核缓冲区 中将数据的长度 ( Length ) , 偏移量 ( Offset ) 拷贝到 Socket 缓冲区 ;

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/139914.html原文链接:https://javaforall.net

(1)
上一篇 2022年5月29日 上午6:16
下一篇 2022年5月29日 上午6:16


相关推荐

  • Tomcat调优和JVM优化[通俗易懂]

    Tomcat调优和JVM优化[通俗易懂]Tomcat本身优化工作方式选择为了提升性能,首先就要对代码进行动静分离,让Tomcat只负责jsp文件的解析工作。如采用Apache和Tomcat的整合方式,他们之间的连接方案有三种选择,JK、http_proxy和ajp_proxy。相对于JK的连接方式,后两种在配置上比较简单的,灵活性方面也一点都不逊色。但就稳定性而言不像JK这样久经考验,所以建议…

    2022年6月7日
    36
  • 高斯滤波器详解

    高斯滤波器详解高斯滤波器详解本文主要介绍了高斯滤波器的原理及其实现过程高斯滤波器是一种线性滤波器 能够有效的抑制噪声 平滑图像 其作用原理和均值滤波器类似 都是取滤波器窗口内的像素的均值作为输出 其窗口模板的系数和均值滤波器不同 均值滤波器的模板系数都是相同的为 1 而高斯滤波器的模板系数 则随着距离模板中心的增大而系数减小 所以 高斯滤波器相比于均值滤波器对图像个模糊程度较小 什

    2026年3月18日
    1
  • pycharm 教育版地址

    pycharm 教育版地址2019 独角兽企业重金招聘 Python 工程师标准 gt gt gt

    2026年3月27日
    1
  • IMEI/ESN/MEID号码「建议收藏」

    IMEI/ESN/MEID号码「建议收藏」IMEI/ESN/MEID号码1、引言   正规的手机产品,在手机软件里面、手机背面以及手机的包装盒子上都是标识有IMEI号码或MEID号码的,这三个号码完全一致的话,才表示这个产品是由这个正规厂家生产的。其中IMEI号码是用于GSM和WCDMA制式的手机,而MEID号码是用于CDMA制式的手机。手机在国内进行入网测试时,是需要提供真实的IMEI或MEID,出口海外的手机也是需要

    2022年8月30日
    4
  • struts2标签详解[通俗易懂]

    struts2标签详解[通俗易懂]struts2标签讲解要使用Struts2的标签,只需要在JSP页面添加如下一行定义即可:<%@taglibprefix="s"uri="/struts-t

    2022年7月2日
    24
  • 魔兽争霸微操教学(精华篇)「建议收藏」

    魔兽争霸微操教学(精华篇)「建议收藏」基础操作:用键盘制造单位,释放魔法,使用物品。魔兽中的一切东西都可以用快捷键来完成,而鼠标只是起到一个定位的作用。比如,暗夜做小精灵,你可以用鼠标点击基地里精灵的头像,也可以直接按w;或者暗夜做月亮

    2022年7月1日
    33

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号