Linux 内存映射 mmap 原理分析-伙伴云

Linux 内存映射 mmap 原理分析

网友投稿 1019 2022-05-28

本文转自博客，我修改了一些笔误，并划了一些我自认为的重点。

原理

首先，“映射”这个词，就和数学课上说的“一一映射”是一个意思，就是建立一种一一对应关系，在这里主要是指硬盘上文件的位置与进程逻辑地址空间中一块大小相同的区域之间的一一对应，如图1中过程1 所示。这种对应关系纯属是逻辑上的概念，物理上是不存在的，原因是进程的逻辑地址空间本身就是不存在的。在内存映射的过程中，并没有实际的数据拷贝，文件没有被载入内存，只是逻辑上被放入了内存，具体到代码，就是建立并初始化了相关的数据结构（struct address_space），这个过程有系统调用mmap()实现，所以建立内存映射的效率很高。

图1.内存映射原理

既然建立内存映射没有进行实际的数据拷贝，那么进程又怎么能最终直接通过内存操作访问到硬盘上的文件呢？那就要看内存映射之后的几个相关的过程了。

mmap() 会返回一个指针 ptr，它指向进程逻辑地址空间中的一个地址，这样以后，进程无需再调用 read 或 write 对文件进行读写，而只需要通过 ptr 就能够操作文件。但是 ptr 所指向的是一个逻辑地址，要操作其中的数据，必须通过 MMU 将逻辑地址转换成物理地址，如图1中过程2 所示。这个过程与内存映射无关。

前面讲过，建立内存映射并没有实际拷贝数据，这时，MMU 在地址映射表中是无法找到与 ptr 相对应的物理地址的，也就是MMU失败，将产生一个缺页中断，缺页中断的中断响应函数会在 swap 中寻找相对应的页面，如果找不到（也就是该文件从来没有被读入内存的情况），则会通过 mmap() 建立的映射关系，从硬盘上将文件读取到物理内存中，如图1中过程3 所示。这个过程与内存映射无关。

如果在拷贝数据时，发现物理内存不够用，则会通过虚拟内存机制（swap）将暂时不用的物理页面交换到硬盘上，如图1中过程4 所示。这个过程也与内存映射无关。

效率

从代码层面上看，从硬盘上将文件读入内存，都要经过文件系统进行数据拷贝，并且数据拷贝操作是由文件系统和硬件驱动实现的，理论上来说，拷贝数据的效率是一样的。但是通过内存映射的方法访问硬盘上的文件，效率要比 read 和 write 系统调用高，这是为什么呢？原因是 read() 是系统调用，其中进行了数据拷贝，它首先将文件内容从硬盘拷贝到内核空间的一个缓冲区，如图2中过程1 ，然后再将这些数据拷贝到用户空间，如图2中过程2 ，在这个过程中，实际上完成了两次数据拷贝；而mmap() 虽然也是系统调用，如前所述，mmap() 中没有进行数据拷贝，真正的数据拷贝是在缺页中断处理时进行的，由于 mmap() 将文件直接映射到用户空间，所以中断处理函数根据这个映射关系，直接将文件从硬盘拷贝到用户空间，只进行了一次数据拷贝。因此，内存映射的效率要比 read/write 效率高

下面这个程序，通过 read 和 mmap 两种方法分别对硬盘上一个名为 “mmap_test” 的文件进行操作，文件中存有 10000 个整数，程序两次使用不同的方法将它们读出，加1，再写回硬盘。通过对比可以看出，read 消耗的时间将近是 mmap 的两到三倍

#include

#define MAX 10000

int main()

{

int i = 0;

int count = 0, fd = 0;

struct timeval tv1, tv2;

int *array = (int *) malloc( sizeof(int) * MAX );

/*read*/

gettimeofday( &tv1, NULL );

fd = open( "mmap_test", O_RDWR );

if ( sizeof(int) * MAX != read( fd, (void *) array, sizeof(int) * MAX ) )

{

printf( "Reading data failed.../n" );

Linux 内存映射 mmap 原理分析

return(-1);

}

for ( i = 0; i < MAX; ++i )

++array[i];

if ( sizeof(int) * MAX != write( fd, (void *) array, sizeof(int) * MAX ) )

{

printf( "Writing data failed.../n" );

return(-1);

}

free( array );

close( fd );

gettimeofday( &tv2, NULL );

printf( "Time of read/write: %dms/n", tv2.tv_usec - tv1.tv_usec );

/*mmap*/

gettimeofday( &tv1, NULL );

fd = open( "mmap_test", O_RDWR );

array = mmap( NULL, sizeof(int) * MAX, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0 );

for ( i = 0; i < MAX; ++i )

++array[i];

munmap( array, sizeof(int) * MAX );

msync( array, sizeof(int) * MAX, MS_SYNC );

free( array );

close( fd );

gettimeofday( &tv2, NULL );

printf( "Time of mmap: %dms/n", tv2.tv_usec - tv1.tv_usec );

return(0);

}

输出结果：

Time of read/write: 154ms

Time of mmap: 68ms

linux 任务调度

CentOS 7.3）下vim命令的使用 - - 实用篇">Linux（CentOS 7.3）下vim命令的使用 - - 实用篇

1019 2022-05-28

进阶（应用篇）之共享内存">LINUX进阶（应用篇）之共享内存

1019 2022-05-28

常用 命令2(升级版)">Linux常用 命令2(升级版)

1019 2022-05-28

Linux 内存 映射 mmap 原理分析

CentOS 7.3）下vim命令的使用 - - 实用篇">Linux（CentOS 7.3）下vim命令的使用 - - 实用篇

进阶（应用篇）之共享内存">LINUX进阶（应用篇）之共享内存

常用 命令2(升级版)">Linux常用 命令2(升级版)

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

什么是在线文档？怎么发在线文档

友情链接

Linux 内存映射 mmap 原理分析

微信扫一扫：分享

CentOS 7.3）下vim命令的使用 - - 实用篇">Linux（CentOS 7.3）下vim命令的使用 - - 实用篇

进阶（应用篇）之共享内存">LINUX进阶（应用篇）之共享内存

常用命令2(升级版)">Linux常用命令2(升级版)

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

友情链接