Redis源码剖析之AOF-伙伴云

Redis源码剖析之AOF

网友投稿 834 2025-03-31

书接上回，上回我们详细讲解了Redis的RDB机制，RDB解决了redis数据持久化一部分的问题，为什么说一部分？因为rdb是redis中某一时刻的快照，那么在这次快照后如果数据有新的变更，它是不会被持久化下来的，必须得等到下次rdb备份。然而，生成rdb是和消耗性能的，所以它就不适合很频繁生成。Redis为了弥补这一不足提供了AOF。

AOF的全称是AppendOnlyFile，源码在aof.c。其实关键就是Append(追加)，核心原理很简单，就是如果执行完命令(set,del,expire……)后，发现有数据变动，就将这次操作作为一条日志记录到aof文件里，如果有宕机就重新加载aof文件，重放所有的改动命令就可以恢复数据了。只要日志被完整刷到了磁盘上，数据就不会丢失。

Redis源码剖析之AOF

配置

AOF的配置比较简单，只有如下几项。

appendonly no # aof开关，默认关闭 appendfilename "appendonly.aof" # 保存的文件名，默认appendonly.aof # 有三种刷数据的策略 appendfsync always # always是只要有数据改动，就把数据刷到磁盘里，最安全但性能也最差 appendfsync everysec # 每隔一秒钟刷一次数据，数据安全性和性能折中，这也是redis默认和推荐的配置。 appendfsync no # 不主动刷，什么时候数据刷到磁盘里取决于操作系统，在大多数Linux系统中每30秒提交一次，性能最好，但数据安全性最差。

源码

AOF的触发

aof如何实现，又是怎么被触发的，让我们详细看下源码。

server.c中的void call(client *c, int flags)是redis接受到client请求后处理请求的入口，其中会检测Redis中的数据有没有发生变化。如果有变化就会执行propagate()函数。

dirty = server.dirty; prev_err_count = server.stat_total_error_replies; updateCachedTime(0); elapsedStart(&call_timer); c->cmd->proc(c); // 执行命令 const long duration = elapsedUs(call_timer); c->duration = duration; dirty = server.dirty-dirty; if (dirty < 0) dirty = 0;

void propagate(struct redisCommand *cmd, int dbid, robj **argv, int argc, int flags) { if (server.in_exec && !server.propagate_in_transaction) execCommandPropagateMulti(dbid); /* This needs to be unreachable since the dataset should be fixed during * client pause, otherwise data may be lossed during a failover. */ serverAssert(!(areClientsPaused() && !server.client_pause_in_transaction)); if (server.aof_state != AOF_OFF && flags & PROPAGATE_AOF) feedAppendOnlyFile(cmd,dbid,argv,argc); // 如果aof开启了，就会向aof传播该命令。 if (flags & PROPAGATE_REPL) replicationFeedSlaves(server.slaves,dbid,argv,argc); }

propagate函数的作用就是将带来数据改动的命令传播给slave和AOF，这里我们只关注AOF，我们来详细看下feedAppendOnlyFile()函数。

AOF数据生成

void feedAppendOnlyFile(struct redisCommand *cmd, int dictid, robj **argv, int argc) { sds buf = sdsempty(); /* The DB this command was targeting is not the same as the last command * we appended. To issue a SELECT command is needed. */ if (dictid != server.aof_selected_db) { char seldb[64]; snprintf(seldb,sizeof(seldb),"%d",dictid); buf = sdscatprintf(buf,"*2\r\n$6\r\nSELECT\r\n$%lu\r\n%s\r\n", (unsigned long)strlen(seldb),seldb); server.aof_selected_db = dictid; } if (cmd->proc == expireCommand || cmd->proc == pexpireCommand || cmd->proc == expireatCommand) { /* 把 EXPIRE/PEXPIRE/EXPIREAT 命令转化为 PEXPIREAT 命令*/ buf = catAppendOnlyExpireAtCommand(buf,cmd,argv[1],argv[2]); } else if (cmd->proc == setCommand && argc > 3) { robj *pxarg = NULL; /* When SET is used with EX/PX argument setGenericCommand propagates them with PX millisecond argument. * So since the command arguments are re-written there, we can rely here on the index of PX being 3. */ if (!strcasecmp(argv[3]->ptr, "px")) { pxarg = argv[4]; } /* 把set命令的expired所带的相对时间转化为绝对时间(ms). */ if (pxarg) { robj *millisecond = getDecodedObject(pxarg); long long when = strtoll(millisecond->ptr,NULL,10); when += mstime(); decrRefCount(millisecond); robj *newargs[5]; newargs[0] = argv[0]; newargs[1] = argv[1]; newargs[2] = argv[2]; newargs[3] = shared.pxat; newargs[4] = createStringObjectFromLongLong(when); buf = catAppendOnlyGenericCommand(buf,5,newargs); decrRefCount(newargs[4]); } else { buf = catAppendOnlyGenericCommand(buf,argc,argv); } } else { /* 其他的命令都不需要转化 */ buf = catAppendOnlyGenericCommand(buf,argc,argv); } /* 追加到AOF缓冲区。在重新进入事件循环之前，数据将被刷新到磁盘上，因此在客户端在执行前就会得到回复。*/ if (server.aof_state == AOF_ON) server.aof_buf = sdscatlen(server.aof_buf,buf,sdslen(buf)); /* 如果后台正在进行AOF重写，我们希望将子数据库和当前数据库之间的差异累积到缓冲区中， * 以便在子进程执行其工作时，我们可以将这些差异追加到新的只追加文件中。 */ if (server.child_type == CHILD_TYPE_AOF) aofRewriteBufferAppend((unsigned char*)buf,sdslen(buf)); sdsfree(buf); }

这里没有啥太复杂的逻辑，就是将命令转化为RESP协议格式的字符串(RESP协议后续会详解)，然后追加到server.aof_buf中，这时候AOF数据还都在缓冲区中，并没有写入到磁盘中，那buf中的数据何时写入磁盘呢？

刷数据

刷数据的核心代码在flushAppendOnlyFile()中，flushAppendOnlyFile在serverCron、beforeSleep和prepareForShutdown中都有被调用，它的作用就是将缓冲区的数据写到磁盘中，代码比较长且复杂，但大部分都是异常处理和性能监控，忽略掉这部分后代码也比较容易理解，这里就不再罗列了，详见aof.c。

RDB vs AOF

最后，我们来对比下RDB和AOF，他们各自都有啥优缺点，该如何选用。

RDB的优势

RDB是压缩的后紧凑数据格式，比较很适合备份，

同样的数据量下，rdb的文件大小会很小，比较适合传输和数据恢复。

RDB对Redis的读写性能影响小，生成RDB的时redis主进程会fork出一个子进程，不会影响到主进程的读写。

RDB数据加载更快，恢复起来更快。

RDB的缺点

RDB是定期备份，如果备份前发生宕机，数据可能会丢失。

RDB的生成依赖于linux的fork，如果数据量比较大的话，很影响服务器性能。

AOF的优势

AOF是持续性备份，可以尽可能保证数据不丢失。

Redis太大时，Redis可以在后台自动重写AOF。重写是完全安全的，因为Redis继续追加到旧文件时，会生成一个全新的文件，其中包含创建当前数据集所需的最少操作集，一旦准备好第二个文件，Redis会切换这两个文件并开始追加到新的那一个。

AOF文件格式简单，易于解析。

AOF的缺点

对于同一数据集，AOF文件大小通常大于等效的RDB文件。

如果使用fsync策略，AOF可能比RDB慢。

RDB和AOF该如何选

如果是要求极致的性能，但对数据恢复不敏感，二者可以都不要，如果是关注性能且关注数据可用性，但不要求数据完整性，可以选用RDB。如果说非常关注数据完整性和宕机恢复的能力，可以RDB+AOF同时开启。

参考资料

Redis persistence demystified

Redis Persistence

本文是Redis源码剖析系列博文，同时也有与之对应的Redis中文注释版，有想深入学习Redis的同学，欢迎star和关注。

Redis中文注解版仓库：https://github.com/xindoo/Redis

Redis源码剖析专栏：https://zxs.io/s/1h

如果觉得本文对你有用，欢迎一键三连。

Redis

机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战（八）- mobot行驶至目标位置">使用机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战（八）- mobot行驶至目标位置

834 2025-03-31

微吼云上线多路互动直播服务加速多场景互动直播落地

834 2025-03-31

HTTP 状态消息

834 2025-03-31

Redis源码剖析之AOF

机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战（八）- mobot行驶至目标位置">使用机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战（八）- mobot行驶至目标位置

微吼云上线多路互动直播服务加速多场景互动直播落地

HTTP 状态消息

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

家居定制平台是什么？">家居定制平台是什么？

进销存库存管理盘点">简单进销存库存管理盘点

友情链接

Redis源码剖析之AOF

微信扫一扫：分享

机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战（八）- mobot行驶至目标位置">使用机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战（八）- mobot行驶至目标位置

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

家居定制平台是什么？">家居定制平台是什么？

进销存库存管理盘点">简单进销存库存管理盘点

友情链接