mysql45讲pdf_讲政策读后感

mysql45讲pdf_讲政策读后感此文为极客时间:MySQL实战45讲的2、15节日志相关部分和网上一些相关文章的内容的总结一、redolog1.概述redolog又叫重做日志,提供的是数据丢失后的前滚操作。redol

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

此文为极客时间:MySQL实战45讲的 2、15节日志相关部分和网上一些相关文章的内容的总结

一、redo log

1.概述

redo log又叫重做日志,提供的是数据丢失后的前滚操作。

redo log是innodb引擎独有的日志,使用了 WAL 技术(Write-Ahead Logging),也就是预写日志。它的关键点就是先写日志,再写磁盘。对应到Mysql中具体操作,就是每次更新操作,先写日志,然后更新内存数据,最后等系统压力小的时候再进行IO更新磁盘数据。避免了每一次更新都需要进行IO操作。redo log 是保证了事务持久性的关键

redo log 一般用在数据库恢复的情况:

  1. 如果是正常运行的实例的话,数据页被修改以后,跟磁盘的数据页不一致,称为脏页。最终数据落盘,就是把内存中的数据页写盘。这个过程,甚至与 redo log 毫无关系
  2. 在崩溃恢复场景中,InnoDB 如果判断到一个数据页可能在崩溃恢复的时候丢失了更新,就会将它读到内存,然后让 redo log 更新内存内容。更新完成后,内存页变成脏页,就回到了第一种情况的状态。

另外,redo log与undo log都被叫做事务日志

2.组成

首先 redo log 包括两部分:

  • 内存中的日志缓冲(redo log buffer),该部分日志是易失性,的其中又分为三部分:
    1. Buffer Pool
    2. Log Buffer
    3. OS Buffer
  • 二是磁盘上的重做日志文件(redo log file),该部分日志是持久的;

由于有时候一次事务可能有多次更新,比如:

begin;
insert into t1 ...
insert into t2 ...
commit;

这个事务要往两个表中插入记录,插入数据的过程中,生成的日志都得先保存起来,但又不能在还没 commit 的时候就直接写到 redo log 文件里。所以就有了 log buffer 这么一块内存,用来先存 redo 日志的。记录了一部分后,根据一定的条件,再最后写入磁盘上的日志文件 log file。

3.日志刷盘策略

由于log buffer处于用户工作空间的内存中,要写入磁盘上的日志文件log file还需要经过操作系统内核空间的os buffer。因此需要调用操作系统的fsync()来完成这一过程。

我们可以简单的理解为os buffer到log files这一过程——也就是日志从内存刷入磁盘的过程——为刷盘。每次事务的提交必然会产生log buffer,但是刷入磁盘的动作却不一定与事务提交同步进行。

mysql45讲pdf_讲政策读后感

InnoDB 有个关键的参数 innodb_flush_log_at_trx_commit 控制 Redo Log 的刷盘策略,该参数有三个取值:

  • 0:每秒刷一次盘。当设置为0的时候,事务提交时不会将 log buffer 中日志写入到 os buffer ,而是每一秒后才一次性将日志写入 os buffer 并调用 fsync() 写入到 log file 中。当系统崩溃,可能会丢失1秒钟的数据。
  • 1:每次提交都刷盘。事务每次提交都会将 log buffer 中的日志写入 os buffer 并调用 fsync() 刷到 log file 中。这种方式即使系统崩溃也不会丢失任何数据,但是因为每次提交都写入磁盘,IO的性能较差。
  • 2:根据innodb_flush_log_at_timeout决定什么时候刷盘。当设置为2的时候,每次提交都仅写入到os buffer,然后是每秒调用fsync()将os buffer中的日志写入到 log file。

4.写入策略

redo log是一个物理日志,我们知道数据库引擎加载是按“页”来的,redo log记录的就是每个“页”上的数据发生的变化。但是不像 binlog 那样,redo log 不记录 sql,而是以类似 session_id + date + file_id + block_id + 修改数据这样的格式去记录数据。

image-20200930111506778

redo log的日志文件大小是根据配置固定的,如果有一组有四个文件,每个文件的大小是 1GB,那么总共就只能记录4GB的日志。

因为redo log是前滚日志,也就是说一旦事务成功提交且数据持久化落盘之后,此时日志中的对应事务数据记录就失去了意义。所以redo log类似一个环形链表,从前往后写,到底了就删除最前面的再回到开头往后写

有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的并且在日志中有记录都数据可以找回,这个能力称为crash-safe。

二、undo log

undo log又叫回滚日志。事务未提交之前,undo log保存了未提交之前的版本数据,可作为数据旧版本快照供其他并发事务进行快照读。

因此,他能够提供两个功能:

  • 回滚:当执行rollback时,就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。

    简单的说:如果我们执行了insert操作,那么日志中就会新增一条相反的delete的sql;

  • 多行版本控制(MVCC):当读取的某一行被其他事务锁定时,它可以从undo log中分析出该行记录以前的数据是什么,从而提供该行版本信息,让用户实现非锁定一致性读取。

undo log保证了事务的原子性。

三、binlog

binlog 又叫二进制日志。是 Server 层特有的日志,无论哪个引擎都能使用。

它被用于记录 mysql 的数据更新(即使更新零条或者删除零条也会记录)。

binlog有三种工作模式:

  • Row :日志中会记录每一行数据被修改的情况,然后在slave端对相同的数据进行修改。
  • Statement:每一条被修改数据的sql都会记录到 master 的 binlog 中,slave 在复制的时候sql进程会解析成和原来 master 端执行过的相同的sql再次执行。
  • Mixed:结合了 Row 和 Statement 的优点,同时 binlog 结构也更复杂。

四、redo log 和 binlog

  • binlog 是 mysql 自带的,redo log 是 innodb 引擎自带的
  • binlog 记录的是每一行数据的变化或修改数据的 sql,redo log 记录的是数据页的变化
  • binlog 能够实现归档功能,通过 binlog 可以实现备份,redo log 是循环写的,历史日志不会一直保留
  • mysql 高可用基于 binlog,像主从等系统机制都依赖于 binlog

五、两阶段提交

1.概述

image-20201011182232866

当innodb执行修改时,会经历一个两阶段提交的过程:

  • 执行器根据sql写入新数据,然后新数据更新到内存里
  • 将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。
  • 执行器生成这个操作的 binlog,并把 binlog 写入磁盘
  • 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成

那么如果事务提交过程中出现了异常,数据库崩溃了,就会有以下几种情况:

  • 写 binlog 前崩溃了:对于时刻A,redo log 还是 prepare,binlog 没写,此时崩溃后事务回滚。

  • 写 binlog 后崩溃了:对于时刻B,redo log 还是 prepare,binlog 已经写了,此时发生崩溃后情况如下:

    1. 如果redo log 已经标记为 commit,则提交事务,重做

    2. 如果redo log 还是 prepare,则去检查 binlog 记录的对应事务是否存在:

      如果存在,就提交事务,重做

      如果不存在,就回滚

2.为什么需要两阶段提交

我们举个反例,说明一下他的必要性。假设我们要更新某条数据的A字段由0变为2:

  • 先 redo log 再 binlog,服务挂了:由于 redo log 还在,可以通过 redo log 恢复数据,A此时是2。但是如果后面要通过binlog恢复数据时,由于binlog中没有这次修改的记录,恢复后的数据库/备份库就会变为0,丢失了这次更新
  • 先 binlog 再 redo log,服务挂了:由于 redo log 没记录这次更新,所以恢复后这次事务无效,A此时是0。但是 binlog 已经有了“A从0变成2这个记录”,所以恢复以后等于多了一次事务

之所以这样做,归根结底是为了保证数据库事务的一致性

因为不管是从库或者备份库都需要通过读取 binlog 来同步数据,所以为了保证保证和主库数据一致,binlog 里记录的每一条事务就必须是已经提交了的,也就是一定要保证往 binlog 里写入数据以后事务不能回滚

总结

  • redo log保证更新不丢失,支持的是事务的持久性
  • undo log保证事务不成功可以回滚,支持的是事务的原子性
  • redo log和binlog的二次提交机制,为事务的一致性提供了一定的保证
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/170788.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux 进入编辑文件,保存退出相关命令「建议收藏」

    linux 进入编辑文件,保存退出相关命令「建议收藏」1.进入文件vim文件名(vimtest.txt)2.编辑完成之后,按ESC键跳到命令模式(命令前面冒号是必要的):  :w保存文件但不退出vi  :wfile将修改另外保存到file中,不退出vi  :w!强制保存,不推出vi  :wq保存文件并退出vi  :wq!强制保存文件,并退出vi  :q不保存文件,退出vi…

    2022年9月28日
    4
  • Python之PIL生成验证码

    Python之PIL生成验证码

    2021年5月24日
    136
  • goland2021的激活码(破解版激活)

    goland2021的激活码(破解版激活),https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月16日
    201
  • 企业微信机器人定时发送信息

    企业微信机器人定时发送信息企业微信可以配置机器人,提升办公效率,还能实现一键群发和定时发送等功能。

    2022年6月16日
    43
  • python循环语句for怎么用_python编程

    python循环语句for怎么用_python编程Python的for循环for语句是Python中执行迭代的两个语句之一,另一个语句是while。如果你对Python的迭代并不是很熟悉的话,Python中的迭代:for、while、break、以及continue语句是一个不错的切入点。Python中,for循环用于遍历一个迭代对象的所有元素。循环内的语句段会针对迭代对象的每一个元素项目都执行一次。暂且可以将迭代对象想象成一个对象集合,我们可以一个个遍历里面的元素。用for循环获取列表元素一、在获取值也获取下标方式一:当在py

    2022年8月12日
    6
  • 影视3D建模和游戏3D建模对比,哪个更有发展前景

    影视3D建模和游戏3D建模对比,哪个更有发展前景影视3D建模和游戏3D建模,两者之间最大和最明显的差异是:游戏开发永远有多边形建模预算。影视建模方面,对于多边形数量都没有限制。对于电影来说,唯一限制是时间,按时,按预算生产合格的模型。游戏建模设计不能随意增加多边形面数,必须依靠纹理细节提升模型的质量。由于多边形数量必须很低,需要其他方法将更多细节放入模型中,目前最好的方法当然是使用纹理。游戏建模设计技术游戏中经常使用的技术是细节层次。意味单个游戏会有几个不同的细节级别。玩家离模型越远,资产的细节就越少。随着玩家越来越近,较低分辨率模型将被.

    2022年5月19日
    56

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号