【MySQL实战45讲基础篇】(task2)日志系统

网友投稿 680 2022-05-28

学习总结

学习 Mysql 里面最重要的两个日志,即物理日志 redo log 和逻辑日志 binlog。

(1)redo log 用于保证 crash-safe 能力。innodb_flush_log_at_trx_commit 这个参数设置成 1 的时候,表示每次事务的 redo log 都直接持久化到磁盘。建议设置成 1,这样可以保证 MySQL 异常重启之后数据不丢失。

(2)sync_binlog 这个参数设置成 1 的时候,表示每次事务的 binlog 都持久化到磁盘。建议设置成 1,这样可以保证 MySQL 异常重启之后 binlog 不丢失。

(3)两个日志之间的三大不同点:

(4)与 MySQL 日志系统密切相关的“两阶段提交”。两阶段提交是跨系统维持数据逻辑一致性时常用的一个方案,即使你不做数据库内核开发,日常开发中也有可能会用到。

文章目录

学习总结

一、物理日志 redo log

1.1 记账栗子

1.2 crash-safe能力

二、逻辑日志 binlog

2.1 redo log和binlog的区别

2.2 update栗子的执行流程

2.3 binlog几大模式

三、两阶段提交

3.1 数据恢复

3.2 为啥需要两阶段提交

【MySQL实战45讲基础篇】(task2)日志系统

(1)先写 redo log 后写 binlog

(2)先写 binlog 后写 redo log

四、作业

Reference

本次task学习redo log(重做日志)和 binlog(归档日志)。

(1)先从一个update栗子开始,首先创建一个表,这个表有一个主键 ID 和一个整型字段 c。如果要将 ID=2 这一行的值加 1,SQL 语句如下::

mysql> create table T(ID int primary key, c int); mysql> update T set c=c+1 where ID=2;

1

2

(2)带着问题学习:怎样让数据库恢复到半个月内任意一秒的状态?

一、物理日志 redo log

1.1 记账栗子

1.2 crash-safe能力

InnoDB 的 redo log 是固定大小的,比如可以配置为一组 4 个文件,每个文件的大小是 1GB,那么这块“粉板”总共就可以记录 4GB 的操作。从头开始写,写到末尾就又回到开头循环写(如下图)。

(1)write pos 是当前记录的位置,一边写一边后移,写到第 3 号文件末尾后就回到 0 号文件开头。

(2)checkpoint 是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录更新到数据文件。

有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为 crash-safe。

二、逻辑日志 binlog

Mysql整体分为server层(负责功能层面)和引擎层(负责存储相关),redo log是InnoDB引擎特有的日志,而server层也有自己的日志——归档日志binlog。

一开始mysql没有InnoDB引擎,其自带的是MyISAM引擎没有crash-safe能力,而当时是以插件的形式引入其他公司的InnoDB。InnoDB使用另一套日志系统redo log来实现crash-safe能力。

2.1 redo log和binlog的区别

redo log 是 InnoDB 引擎特有的;binlog 是 MySQL 的 Server 层实现的,所有引擎都可以使用。

redo log 是物理日志,记录的是“在某个数据页上做了什么修改”;binlog 是逻辑日志,记录的是这个语句的原始逻辑,比如“给 ID=2 这一行的 c 字段加 1 ”。

redo log 是循环写的,空间固定会用完;binlog(逻辑日志) 是可以追加写入的。“追加写”是指 binlog 文件写到一定大小后会切换到下一个(生成一个新的文件),并不会覆盖以前的日志。

2.2 update栗子的执行流程

回到开头update的例子,看执行流程。

浅色框表示是在 InnoDB 内部执行的,深色框表示是在执行器中执行的。

执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。

执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的一行数据,再调用引擎接口写入这行新数据。

引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log(物理日志) 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。

执行器生成这个操作的 binlog(逻辑日志),并把 binlog 写入磁盘。

执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成。

2.3 binlog几大模式

三、两阶段提交

刚才上图的最后三步看上去有点“绕”,将 redo log 的写入拆成了两个步骤:prepare 和 commit,这就是"两阶段提交"。

3.1 数据恢复

开头说的让数据库恢复到半个月内任意一秒的状态的问题:

binlog(MySQL 的 Server 层实现的,所有引擎都可以使用)会记录所有的逻辑操作,用“追加写”方式,如果DBA说半个月可以恢复,则说明备份系统中保存了最近半个月所有的binlog(系统会定期备份)。

ex:想要找到到最近某天误删的数据,可以把备份的binlog依次取出,这时临时库就和误删前的数据库一样了,可以取出所要的数据。

3.2 为啥需要两阶段提交

为啥日志需要两阶段提交,我们使用反证法。

由于 redo log 和 binlog 是两个独立的逻辑,

如果不用两阶段提交,要么就是先写完 redo log 再写 binlog,或者采用反过来的顺序

。看看这两种方式会有什么问题。

仍然用前面的 update 语句来做例子。假设当前 ID=2 的行,字段 c 的值是 0,再假设执行 update 语句过程中在写完第一个日志后,第二个日志还没有写完期间发生了 crash,会出现什么情况呢?

(1)先写 redo log 后写 binlog

假设在 redo log 写完,binlog 还没有写完的时候,MySQL 进程异常重启。由于我们前面说过的,redo log 写完之后,系统即使崩溃,仍然能够把数据恢复回来,所以恢复后这一行 c 的值是 1。但是由于 binlog 没写完就 crash 了,这时候 binlog 里面就没有记录这个语句。因此,之后备份日志的时候,存起来的 binlog 里面就没有这条语句。然后你会发现,如果需要用这个 binlog 来恢复临时库的话,由于这个语句的 binlog 丢失,这个临时库就会少了这一次更新,恢复出来的这一行 c 的值就是 0,与原库的值不同。

(2)先写 binlog 后写 redo log

如果在 binlog 写完之后 crash,由于 redo log 还没写,崩溃恢复以后这个事务无效,所以这一行 c 的值是 0。但是 binlog 里面已经记录了“把 c 从 0 改成 1”这个日志。所以,在之后用 binlog 来恢复的时候就多了一个事务出来,恢复出来的这一行 c 的值就是 1,与原库的值不同。

不只是误操作后需要用这个过程来恢复数据。当你需要扩容的时候,也就是需要再多搭建一些备库来增加系统的读能力的时候,现在常见的做法也是用全量备份加上应用 binlog 来实现的,这个“不一致”就会导致你的线上出现主从数据库不一致的情况。

小结:redo log 和 binlog 都可以用于表示事务的提交状态,而两阶段提交就是让这两个状态保持逻辑上的一致。

四、作业

前面说到定期全量备份的周期“取决于系统重要性,有的是一天一备,有的是一周一备”。那么在什么场景下,一天一备会比一周一备更有优势呢?或者说,它影响了这个数据库系统的哪个指标?

【答】首先,是恢复数据丢失的时间,既然需要恢复,肯定是数据丢失了。如果一天一备份的话,只要找到这天的全备,加入这天某段时间的binlog来恢复,如果一周一备份,假设是周一,而你要恢复的数据是周日某个时间点,那就,需要全备+周一到周日某个时间点的全部binlog用来恢复,时间相比前者需要增加很多;看业务能忍受的程度

其次,是数据库丢失,如果一周一备份的话,需要确保整个一周的binlog都完好无损,否则将无法恢复;而一天一备,只要保证这天的binlog都完好无损;当然这个可以通过校验,或者冗余等技术来实现,相比之下,上面那点更重要

Reference

(1)《MySQL实战45讲》

(2)https://www.cnblogs.com/luoahong/p/10385466.html

MySQL 数据库

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Google Earth Engine(GEE)——导出数据到Google硬盘和云端存储!和最大像素限制导出
下一篇:面试官:谈谈Redis缓存和MySQL数据一致性问题
相关文章