详解MySQL隔离级别

3年前 (2022) 程序员胖胖胖虎阿

306 0 0

一个事务具有ACID特性，也就是（Atomicity、Consistency、Isolation、Durability，即原子性、一致性、隔离性、持久性），本文主要讲解一下其中的Isolation，也就是事务的隔离性。

概述

四种隔离级别分别是：

读未提交（read uncommitted）
- 一个事务还没提交时，它修改的数据都可以被别的事物看到。
读已提交(read committed)
- 一个事务提交之后，它修改的数据才会被别的事物看到。
可重复读(repeatable read)
- 一个事务执行过程中看到的数据，总是和这个事务开启时看到的数据是一致的。在可重复读的隔离级别下，未提交的事务对其他事务也是不可见的。
串行化(serializable)
- 数据的读和写都会加锁，读会加读锁，写会加写锁。当遇到读写锁冲突时，后访问的事务必须等前一个事务执行完成后，再继续执行。

以上四种隔离级别，由上往下隔离强度越来越大，但是执行效率会随之降低。在设置隔离级别时候，需要在隔离级别和执行效率两者做平衡取舍。

为了便于理解，下面就举一个例子：

详解MySQL隔离级别

在不同隔离级别下，事务A会有哪些不同的返回结果，也就是图中的V1、V2、V3的返回值分别是什么。

如果隔离级别是读未提交，事务B修改后数据无需提交事务，就能被事务A读取，所以V1、V2、V3的值都是2。
如果隔离级别是读已提交，事务B修改后需要提交后，修改后的数据才能被事务A读取，所以V1的值是1，事务B提交，事务A读取修改后的数据,所以V2的值是2,V3的值也是2。
如果隔离级别是可重复读，整个事务看到的事务和事务开启时看到的数据是一致的，开启看到的数据是1，所以V1、V2的值都是1,事务A提交之后，获取到修改后的数据，所以V3的值是2。
如果隔离级别是串行化，会被锁住，此时事务B对应的线程处于阻塞状态，直到事务A提交之后，事务B才会继续将1改成2。所以V1、V2的值是1，V3的值是2。

MySQL默认的隔离级别是可重复读。

隔离级问题

先了解几个基本概念：

脏读：事务A修改数据，事务B读取了数据后事务A报错回滚，修改的数据没有提交到数据库中，此时事务B读取修改的数据就是一个脏读，也就是一个事务读取到另一个事务未提交的数据就是脏读。

不可重复读：事务A在同一个事务上多次读取同一个数据，在事务A还没有结束时，事务B修改了该数据，由于事务B的修改，导致事务A两次读取的数据不一致，就出现了不可以重复读的现象。

幻读：事务A根据条件查询得到N条数据，但此时事务B更改或者增加了M条符合事务A查询的条件的数据。这样当事务A再次查询的时候发现会有N + M条数据，产生了幻读。

几种隔离级别可能会有脏读、不可重复读或者幻读的问题，它们之间的关系如下：

隔离级别	脏读	不可重复读	幻读
`读未提交`	`√`	`√`	`√`
`读提交`	`×`	`√`	`√`
`可重复读`	`×`	`×`	`√`
`串行化`	`×`	`×`	`×`

读未提交：可能会出现脏读、不可重复读、幻读，读取未提交事务的数据，数据撤回了，就是一种脏读。如果其他事务修改同一个数据，事务读取的数据也是不同的，所以也存在不可重复读。同时也能读取到其他事务添加的数据，所以也存在幻读。
读已提交：该隔离级别只能读取到其他事务提交后的数据，所以不存在脏读。但是在第一次读取数据后，其他事务修改后数据并提交事务，此时事务读取到数据就和第一次读到的数据不一致了，也就存在不可重复读。同时其他事务可以添加多条数据，也存在幻读。
可重复度读：表示整个事务看到的事务和开启后的事务能看到的数据是一致的，既然数据是一致的，所以不存在不可重复读。而且不会读取其他事务修改的数据，也就是不存在脏读。而对同一个批数据，可能会存在添加的情况，所以可能会存在幻读的情况。
窜行化：当发生读写锁冲突时，后面的事务要等前面的事务执行完毕之后再执行，所以一定是先读或者先写的执行完毕之后再执行后读或者写，读写按照顺序依次进行，所以不存在脏读、不存在不可重复读、也不存在幻读。

隔离级别原理

隔离级别的主要是多版本并发控制MVCC,MVCC是通过保存数据在某个时间点的快照来实现的。

InnoDB实现的MVCC，是通过在每行记录后面保存两个隐藏列来实现，一个是保存行的创建时间，另一个是保存行的过期时间。当然存储的不是时间，而是系统版本号。每开启一个新的事务，系统版本号先自动递增，该系统版本号会作为事务的版本号，用来和查询到的每行记录的版本号做比较。比如在可重复读隔离级别下，MVCC是如何操作的：

SELECT
- InnoDB会根据以下两个条件检查每行记录：
  - 1. InnoDB只查找版本号早于当前事务的数据行（系统版本号小于或者等于事务的系统版本号），这样可以确保事务读取的行，要么是在事务开始前就存在，要么是事务自身插入或者更新过。
  - 1. 行的删除版本要么未定义，要么大于当前事务版本号。这可以确保事务读取到的行，在事务开始之前未被删除。
- 只有符合上述两个条件的记录，才能返回作为查询的结果。
INSERT
- InnoDB为新插入的每一行保存当前系统版本号作为行版本号。
DELETE
- InnoDB为删除的每一行保存当前系统版本号作为行删除的标识。
UPDATE
- InnoDB为插入一行新记录，保存当前系统版本号作为行版本号，同时保存当前系统版本号到原来的行作为行删除标识。

保存着两个额外的系统版本号，大多数读操作都可以不用加锁。这样设计是的读数据的操作很简单，性能很好，并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间，需要做更多的行检查工作，以及一些额外的维护工作。

MVCC只在读已提交和可重复读两个隔离级别下生效。其他两个隔离级别下MVCC都不能生效，因为读未提交总是读取到最新的数据行，无需记录当前事务版本号。而串行化会对所有的读写都会进行加锁，先读、先写的先执行，后读、后写的后执行。也不需要记录记录版本号精心比对。

InnoDB的行数据有多个版本，每个数据版本都有自己的row trx_id，每个事务或者语句都有自己的一致性视图。查询语句是一致性读，一致性读会根据row trx_id和一致性视图确定数据版本的可见性。

可重复读，只查询在事务启动前就提交完成的数据。
读已提交，只查询语句启动前其他事务提交的数据。

总结

四种隔离级别:
- 读未提交：数据会读取其他事务未更新到数据的数据。可能会存在脏读、不可重复读、幻读的问题。
- 读已提交(read committed)：数据只能读取其他事务提交的数据，不存在脏读，但是可能会存在不可重复读、幻读的问题。
- 可重复读(repeatable read):事务执行过程中看到的数据，总是和这个事务开启时看到的数据是一致的。在可重复读的隔离级别下，未提交的事务对其他事务也是不可见的。不存在脏读、不可重复读，但是可能会存在幻读问题。
- 串行化(serializable)：存在读写锁冲突时，后访问的事务会等前一个事务执行完毕后，再继续执行。
MySQL采用了MVVC(多版本并发控制)解决读已提交、可重复读隔离问题。
- 执行一条SQL语句，都会保存两个隐藏的列。一个是保存创建时间，一个保存过期时间，储存的系统版本号。
- 每次开启一个事务都会系统会递增一个系统版本号,作为事务的版本号。
  - select，查询早于当前事务的数据。
  - insert添加版本号。
  - delete为删除的行把版本号作为删除标识。
  - update，先插入一条数据，保存当前系统版本号。同时保存原来的行作为行删除标志。