写点什么

MySQL 锁系统总结

  • 2021-03-26
  • 本文字数:6898 字

    阅读完需:约 23 分钟

MySQL锁系统总结

innoDB 锁简介

innoDb 支持多种粒度的锁,按照粒度来分,可分为表锁(LOCK_TABLE)行锁(LOCK_REC)

一般的锁系统都会有共享锁排他锁的分类,共享锁也叫读锁排他锁也叫写锁。加在同一个资源上,写锁会阻塞另外一把写锁或读锁的获取,读锁则允许另外一把读锁的获取,也就是读读之间允许并发,读写或者写写会阻塞,innodb 中表锁和行锁都支持共享锁(简写S)排他锁(简写X)


因为 innoDB 支持多粒度的锁,允许表锁和行锁的并存,为了方便多粒度锁冲突的判断,innoDB 中还存在一种名叫意向锁(Intention Locks)的锁。


除此之外,还有一种特殊的表锁,自增锁,主要用来并发安全的生成自增 id,一种特殊的意向锁,插入意向锁,用来防止幻读问题

表锁

表锁,锁定的粒度是整个表,也分共享锁和排他锁。不同于行锁,表锁 MySQL Server 层就有实现(所以 MyISAM 支持表锁,也只支持表锁),innoDb 则在存储引擎层面也实现了一遍表锁(后面会介绍具体结构)。


哪些时候会触发表锁呢?在执行某些 ddl 时,比如alter table等操作,会对整个表加锁,也可以手动执行锁表语句:LOCK TALBES table_name [READ | WRITE],READ 为共享锁,WRITE 为排他锁,手动解锁的语句为:UNLOCK TABLES,会直接释放当前会话持有的所有表锁

有一些需要注意的地方:


  • 因为 MySQL Server 层和 InnoDB 都实现了表锁,仅当autocommit=0innodb_table_lock=1(默认设置)时,InnoDB 层才能知道 MySQL 加的表锁,MySQL Server 才能感知 InnoDB 加的行锁,这种情况下,InnoDB 才能自动识别涉及表级锁的死锁,否则,InnoDB 将无法自动检测并处理这种死锁

  • 在用LOCK TALBES显式获取锁后,只能访问加锁的这些表,并且如果加的是共享锁,那么只能执行查询操作,而不能执行更新操作,如果获得的是排他锁,则可以进行更新操作。

  • 开始事务时会自动 UNLOCK 之前的表锁,COMMIT 或 ROLLBACK 都不能释放用LOCK TABLES加的表级锁。LOCK TALBES时会先隐式提交事务,再锁表,UNLOCK TALBES也会隐式提交事务。所以,事务中需要的表锁必须在事务开头一次性获取,无法再事务中间获取,因为不管是LOCK TALBES还是UNLOCK TALBES都会提交事务


官网上建议的表锁的使用方法:


SET autocommit=0;LOCK TABLES t1 WRITE, t2 READ, ...;... do something with tables t1 and t2 here ...COMMIT;UNLOCK TABLES;
复制代码


实际业务中,没有特殊理由,不建议使用表锁,因为锁的粒度太大了,极大的影响并发。

意向锁

意向锁是一种特殊的表级锁,意向锁是为了让 InnoDB 多粒度的锁能共存而设计的。取得行的共享锁和排他锁之前需要先取得表的意向共享锁(IS)和意向排他锁(IX),意向共享锁和意向排他锁都是系统自动添加和自动释放的,整个过程无需人工干预。 主要是用来辅助表级和行级锁的冲突判断,因为 Innodb 支持行级锁,如果没有意向锁,则判断表锁和行锁冲突的时候需要遍历表上所有行锁,有了意向锁,则只要判断表是否存在意向锁就可以知道是否有行锁了。表级别锁的兼容性如下表:



图片可以看到,意向锁与意向锁兼容,IX、IS 自身以及相互都兼容,不互斥,因为意向锁仅表示下一层级加什么类型的锁,不代表当前层加什么类型的锁;IX 和表级 X、S 互斥;IS 和表级 X 锁互斥。其兼容性正好体现了其作用。

自增锁

自增锁是一种特殊的表级别锁,如果一个表的某个行具有 AUTO_INCREMENT 的列,则一个事务在插入记录到这个表的时候,会先获取自增锁。如果一个事务持有自增锁,会阻塞其他事物对该表的插入操作,保证自增连续。innodb_autoinc_lock_mode 变量定义了不同的自增算法,在 MySql8.0 之前默认值是 1,MySql8.0 之后默认值是 2,具体区别参考官方文档(https://dev.mysql.com/doc/refman/8.0/en/innodb-auto-increment-handling.html)

行锁

Innodb 中的行锁种类繁多,可以分为:记录锁(record locks)、间隙锁(gap locks)、临键锁(next-key locks),插入意向锁(insert intention locks)。行锁在逻辑上都可以看作作用于索引或者索引间隙之上,索引分为主键索引和非主键索引两种,如果一条 sql 语句操作了主键索引,MySQL 就会锁定这条主键索引;如果一条语句操作了非主键索引,MySQL 会先锁定该非主键索引,再锁定相关的主键索引。


很多语句都会加行锁,比如 Update、Delete、Insert 等操作,或者使用 SELECT ... FOR SHARE | UPDATE [NOWAIT |SKIP LOCKED]来进行当前读(Locking Reads),其中 SHARE 表示加共享锁,UPDATE 表示加排他锁。当要加的锁与当前行已有锁互斥时,会一直阻塞等待一段时间(innodb_lock_wait_timeout 定义了等待时间)。加上 NOWAIT 参数则不会阻塞,会立即返回,并显示一个错误,加上 SKIP LOCKED 则会在结果集中跳过这些冲突的记录(慎用)。


在不同的语句,不同的事务隔离级别下,甚至不同的索引类型下,行锁会表现成不同的形式,下面介绍这些形式:

记录锁(record locks)

在逻辑上,记录锁可以理解为锁定的是某个具体的索引,当 SQL 执行按照唯一性(Primary key、Unique key)索引进行数据的检索时,查询条件等值匹配且查询的数据是存在,这时 SQL 语句加上的锁即为记录锁。

图片间隙锁(gap locks)


在逻辑上,间隙锁可以理解为锁住的是索引之间的间隙,是一个左开右开的区间。当 SQL 执行按照索引进行数据的检索时,查询条件的数据不存在,这时 SQL 语句加上的锁即为间隙锁。


图片如上图,因为这些语句查询的值都不存在,所以锁住的都是间隙。并且在 InnoDb 存储引擎里,每个数据页中都会有两个虚拟的行记录,用来限定记录的边界,分别是:Infimum Record 和 Supremum Record,Infimum 是比该页中任何记录都要小的值,而 Supremum 比该页中最大的记录值还要大,这两条记录在创建页的时候就有了,并且不会删除。所以当查询的值比当前已有记录最大值还大时候,锁住的会是最大值到 Supremum 之间的间隙。比如第一条语句,查询的时候就算是等值匹配,只要这个不存在的数据落在两个索引节点之间,就算不是一个范围,也会锁住索引节点间的所有数据即 gap3,范围(7,11)。


间隙锁是可以共存的,共享间隙锁与独占间隙锁之间是没有区别的,两者之间并不冲突。其存在的目的都是防止其他事务往间隙中插入新的纪录,故而一个事务所采取的间隙锁是不会去阻止另外一个事务在同一个间隙中加锁的


间隙锁是设计用来防止幻读的,当锁定一个 gap 时,其他事务没有办法再往这个 gap 中插入数据,PostgreSQL 没有这种机制,所以 PostgreSQl 没有办法锁住不存在的行,无法防止幻读

临键锁(next-key locks)

在逻辑上,临键锁可以理解为锁住的是索引本身以及索引之前的间隙,是一个左开右闭的区间。当 SQL 执行按照非唯一索引进行数据的检索时,会给匹配到行上加上临键锁。


图片如上图,当执行 select * from table_name where id = 3 for update 时会锁定(-∞,3)区间,因为按照这个 SQL 的语义,即是为了锁住 id=3 的数据,不允许其他操作,如果只是锁住记录本身,肯定是没有办法保证的,因为这是非唯一索引,还有可能插入其他 id=3 的数据,如果把间隙都给锁住,则其他对这个间隙的插入操作都会被阻塞,从而保证了一致性,这也是临键锁的用意。


如果加锁时,查询条件没有命中索引(非 ICP 的查询),则 InnoDB 会尝试给全表每一条记录都加上临键锁,效果相当于锁表了

插入意向锁(insert intention locks)

插入意向锁是一种间隙锁形式的意向锁,在真正执行 INSERT 操作之前设置。当执行插入操作时,总会检查当前插入操作的下一条记录(已存在的主索引节点)上是否存在锁对象,判断是否锁住了 gap,如果锁住了,则判定和插入意向锁冲突,当前插入操作就需要等待,也就是配合上面的间隙锁或者临键锁一起防止了幻读操作。 因为插入意向锁是一种意向锁,意向锁只是表示一种意象,所以插入意向锁之间不会互相冲突,多个插入操作同时插入同一个 gap 时,无需互相等待,比如当前索引上有记录 4 和 8,两个并发 session 同时插入记录 6,7。他们会分别为(4,8)加上 GAP 锁,但相互之间并不冲突。


INSERT 语句在执行插入之前,会先在 gap 中加入插入意向锁,如果是唯一索引,还会进行 Duplicate Key 判断,如果存在相同 Key 且该 Key 被加了互持锁,则还会加共享锁,然后等待(因为这个相同的 Key 之后有可能会回滚删除,这里非常容易死锁)。等到成功插入后,会在这条记录上加排他记录锁。

行锁小结

行锁在不同的语句中和环境条件下可以表现成:记录锁(record locks)、 间隙锁(gap locks)、临键锁(next-key locks)和插入意向锁(insert intention locks)。记录锁锁住具体的记录,间隙锁锁住记录之间的间隙,临键锁锁住记录和记录前面的间隙,插入意向锁则是特殊的间隙锁,在插入前判断行将要插入的间隙是否会有冲突。


以上说的各种行锁的加锁情况都是在可重复读(REPEATABLE READ)隔离级别下,这个级别也是 innoDB 默认的事务隔离级别,是最常用的隔离级别,但是其实不同语句在不同隔离级别下加锁的情况会有非常大的区别,以下会简单说明。

不同语句和隔离级别对加锁的影响

这里先排除读未提交(READ UNCOMMITTED)这种隔离级别的情况,这种级别在生产上几乎无法使用,会出现脏读的情况,不一致读,无法保证事务的 ACID。然后先看下串行化(SERIALIZABLE)隔离级别。


串行化隔离级别和可重复读隔离级别最大的区别应该是,innoDB 会隐式的转换所有的 SELECT 语句,给其加共享锁,变成 SELECT ... FOR SHARE,这样读操作会阻塞其他写操作,使得读写无法并发,只能串行,从而保证严格的一致性。不过这种行为也受到 autocommit 变量的影响:


如果禁用了 autocommit,如上所述,则 innoDB 会隐式的转换所有的 SELECT 语句,给其加共享锁


如果开启了 autocommit,不会进行隐式转换,因为每条语句构成一个事务,所有快照读语句(也就是没有 FOR UPDATE|SHARE 的 SELECT 语句)可以被认为是只读的事务,是可以安全并发,不需要阻塞其他事务


不可重复读(READ COMMITTED)隔离级别下,和可重复读隔离级别在行锁方面主要的区别是:


不可重复读隔离级别下取消了间隙锁,临键锁也退化成了记录锁。间隙锁定和临键锁仅用于外键约束检查和重复键检查,也就是说加锁时,如果没有符号条件的查询并不加锁,有符合条件的查询也只会给记录加上记录锁。因为没有了间隙锁,所以会出现幻读问题。


在可重复读隔离级别下,加锁时如果查询条件没有命中索引(非 ICP 的查询),则会给表中每条记录都加上临键锁。而不可重复读隔离级别下因为没有间隙锁,则会退化成给表中每条数据加上记录锁,并且还会把没有匹配的行上的锁给释放掉,而不是把全表所有记录不管有没有匹配都给锁上。


7 死锁因为使用表锁时,需要一次性申请所有所需表的锁,所以在只使用表锁的情况下不会出现死锁,一般出现死锁的情况都是行锁。innoDB 有死锁探测机制,在申请锁的时候,都会先进行死锁判断,采用的算法深度优先搜索,并且如果在搜索过程中发现有环,就说明发生了死锁,为了避免死锁检测开销过大,如果搜索深度超过了 200(LOCK_MAX_DEPTH_IN_DEADLOCK_CHECK)也同样认为发生了死锁。出现死锁时,innoDB 会选择一个回滚代价比较小的事务进行回滚。以下会举几个比较典型的死锁例子(均在可重复度隔离级别下),首先会先建一张测试的表:


CREATE TABLE `student` (`id` int NOT NULL,`uuid` varchar(64) NOT NULL,`name` varchar(64) NOT NULL,`age` int NOT NULL,PRIMARY KEY (`id`),UNIQUE KEY `uuid_index` (`uuid`),KEY `name_index` (`name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci
复制代码

死锁例一

语句顺序\事务事务一事务二
T1begin;begin;
T2select * from student where id = 1  for update;select * from student where id = 2 for update;
T3select * from student where id = 2  for update;
T4(死锁发生)
select * from student where id = 1 for update;


这是最简单最典型的死锁的情况了,两个事务互相锁定持有资源,并且等待对方的资源,最后形成一个环,死锁出现。最后某个事务回滚,写业务代码的时候,应该对并发条件可能出现这种情况的语句有所警觉。

死锁例二


前提:事务开始时,student 表里有 id=1 的记录



语句顺序\事务
事务一事务二
T1begin;begin;
T2select * from student where id = 1  for share;select * from student where id = 1 for share;
T3update student set name = 'Tom' where id = 1;
T4(死锁发生)
update student set name = 'Jack' where id = 1;


死锁例三

前提:事务开始时,student 表里没有 id=100 的记录



语句顺序\事务
事务一事务二
T1begin;begin;
T2select * from student where id = 100 for update;select * from student where id = 100 for update;
T3insert into student values (100, 'uuid100', 'jack', 18);
T4(死锁发生)
insert into student values (100, 'uuid100', 'jack', 18);

死锁例四


前提:事务开始时,student 表里没有 uuid=uuid100 的记录



语句顺序\事务
事务一事务二事务三
T1begin;begin;begin;
T2insert into student values (100, 'uuid100', 'jack', 18);

T3
insert into student values (101, 'uuid100', 'jack', 18);insert into student values (102, 'uuid100', 'jack', 18);
T4(死锁发生)rollback;


这也是 MySql 官方文档给出的一个例子。三个事务同时插入一条某个唯一索引属性(上面的 uuid)相同的数据,其中某个事务先一步插入,其他两个事务会阻塞等待,然后先一步插入的事务回滚,其他两个事务出现死锁,其中某个事务会被回滚。官方文档还提到了另外一种类似的情况,具体可以参考 Locks Set by Different SQL Statements in InnoDB


这种死锁的原因是,INSERT 的时候,会对唯一索引进行 Duplicate Key 判断,如果唯一键冲突,则会加共享锁等待,也就是 T3 时候的事务二和事务三,都会获得共享锁。T4 时,事务一回滚,事务二和事务三都会申请升级排他锁,这样就造成类似死锁案例二的情况,形成死锁了。

死锁例五



语句顺序\事务
事务一事务二
T1begin;begin;
T2(死锁发生)update student set age = age + 1 where name = 'jack';update student set name = 'bob' where id > 100;

死锁小结

使用 SHOW ENGINE INNODB STATUS 语句可以看到最近一次的死锁信息,在调试的时候很有帮助。


出现死锁后某个事务会回滚,其他事务成功,上层业务会捕获到死锁错误,再重试一般会成功,如果出现大量锁重试,则说明哪里出了问题,写代码的时候可以注意以下几点可以减少死锁出现的概率:


  • 类似的业务逻辑尽量以固定的顺序访问表和行

  • 如果业务允许,大事务拆小,大事务持有锁的时间更长,更容易出现死锁

  • 为表添加合理的索引,可以看到可重复读级别下,如果不走索引(非 ICP 的查询)将会为表的每一行记录加锁

  • 尽量少用 for share 或者 for update 语句,虽然看起来只是在一行记录上加锁,但是由于间隙锁和临键锁的存在,锁住的可能不止是一行记录

  • 提前申请足够强度的锁,不要先用 for share 锁住行,后面再 update,很容易死锁。

锁的内部表示

innoDb内部中,用unsigned long类型表示锁的类型,其中不同的位代表锁不同的信息,最低的 4 位表示 lock_mode,中间的 4 位表示 lock_type,其余高位表示 record_lock_type,内部使用位操作来设置和判断是否设置了对应的值 :


| record_lock_type | lock_type  | lock_mode | --- | --- | ---

lock_mode:描述了锁的基本类型,分为以下几种


  • LOCK_IS: 意向共享锁

  • LOCK_IX: 意向排他锁

  • LOCK_S: 共享锁

  • LOCK_X: 排他锁

  • LOCK_AUTO_INC: 自增锁


在源码中有一个 lock_mode 的枚举类型,除了以上还有几个值:LOCK_NONE,用来表示一致性读,LOCK_NUM 用来表示 lock_mode 的数量,LOCK_NONE_UNSET 用来复位低 8 位  

lock_type:占用中间的 4 位,目前只用到了 5 位和 6 位,分别表示表锁(LOCK_TABLE)和 行锁(LOCK_REC)

record_lock_type:对于表锁类型来说都是空的,对于行锁目前值有:

  • LOCK_WAIT:表示正在等待锁

  • LOCK_ORDINARY:表示临键锁

  • LOCK_GAP:表示间隙锁

  • LOCK_REC_NOT_GAP:表示记录锁

  • LOCK_INSERT_INTENTION:表示插入意向锁

  • LOCK_CONV_BY_OTHER:表示锁是由其它事务创建的(比如隐式锁转换)

以上说的是锁的类型的表示,行锁、表锁类型相关信息都统一到一个字段了。同类型字段一样,行锁、表锁本身在innoDb中也统一用一个结构体来表示lock_t,大体如下:


struct lock_t {  trx_t* trx; // 锁所属的事务  UT_LIST_NODE_T(lock_t) trx_locks; // 事务所持锁的列表  ulint type_mode; // 锁类型  hash_node_t hash; // 全局锁哈希表对应的节点  dict_index_t* index; // 行锁的行记录索引  union {      lock_table_t; // 表锁       lock_rec_t rec_lock; // 行锁  } un_member; // 锁详情};
复制代码


行锁和表锁都用一个lock_t结构来表示,差异部分在一个 union 结构中表示,里面的 type_mode 即是上面介绍的锁类型,行锁的结构如下:


struct lock_rec_t {  ulint space; // 锁的space id  ulint page_no; // 锁的page number  ulint n_bits; // 锁住位置的bitmap};
复制代码


通过(space,page_no)可以确定锁所在的页,innoDb内部还会有个字段heap_no来表示记录在页上的偏移,也就是说三元组(space,page_no,heap_no)可以唯一的确定一行的位置。在分配lock_rec_t结构的时候,还会为其在最后分配一个大小为 n_bits 的 bitmap,而记录偏移的 bit 即为heap_no,用来快速判断这页哪些记录加了锁。


innoDb所有的行锁会插入到一个全局 hash 表(lock_sys->rec_hash)中,相同(space,page_no)也就是同一页的锁会被 Hash 到同一个 bucket 里,通过lock_t->hash串成链表。


总结一下,就是同一事务,同一类型的行锁在同一页上会复用同一个锁结构lock_t,用后面的 bitmap 来具体表示锁哪些行,大大节约了空间。同一页上不同的事物或类型的锁通过链表串起来放在rec_hash的同一个 bucket 里,利用 hash 的结构先定位到页,然后遍历同一页上不同的lock_t,就可以得到哪些事物的哪些锁锁住了哪些行,这种设计平衡了时间和空间的效率。

总结

innoDB 锁系统配合 MVCC 机制一起实现了事务的一致性隔离性,innoDB 中的锁总类繁多,并且和事务隔离级别关系密切,不同语句在不同隔离级别下的加锁情况大有不同,细节尤其多,而了解这些对排查死锁会有很大的帮助。行锁在 innoDB 中的实现也颇为巧妙,值得学习。

参考链接

  • https://schecterdamien.github.io/2021/03/04/mysql-lock/

  • https://dev.mysql.com/doc/refman/8.0/en/innodb-locking.html

  • http://mysql.taobao.org/monthly/2017/12/02/

  • http://mysql.taobao.org/monthly/2016/01/01/

  • http://mysql.taobao.org/monthly/2018/05/04/

  • https://www.aneasystone.com/archives/2017/12/solving-dead-locks-three.html

  • https://www.cnblogs.com/jojop/p/13982679.html


本文转载自:360 技术(ID:qihoo_tech)

原文链接:MySQL锁系统总结

2021-03-26 07:007989

评论

发布
暂无评论
发现更多内容

明修"栈"道——越过Android启动栈陷阱

vivo互联网技术

flag Activity启动 应用栈Task

css动若脱兔转换视差效果

格斗家不爱在外太空沉思

CSS 三周年连更

国内服务器终于支持ChatGPT接入到公众号了

派大星

ChatGPT

阿里内部出品的这5份Java资料的含金量有多高,你不会还不知道吧

会踢球的程序源

Java 程序员 面试 java面试 构架师

Groovy def关键字妙用

FunTester

基于多场景化解决方案,华为云助力制造业企业走出数字化转型困境

YG科技

一文详解 PoseiSwap,Nautilus Chain 上的首个 DEX

西柚子

华为云数字化转型解决方案 助力制造业企业迈向智能化

YG科技

游戏内嵌社区服务开放,助力开发者提升玩家互动与留存

HarmonyOS SDK

HMS Core

测试环境治理之MYSQL索引优化篇

京东科技开发者

MySQL 性能优化 测试环境 企业号 4 月 PK 榜

GitHub重磅上线!开源分布式架构原理设计笔记

小小怪下士

Java 程序员 分布式 分布式架构

剖析多利熊业务如何基于分布式架构实践稳定性建设

百度Geek说

分布式 稳定性 多利熊 企业号 4 月 PK 榜

Dock优化工具:HyperDock mac中文激活版

真大的脸盆

Mac Mac 软件 优化工具

深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测

汀丶人工智能

人工智能 机器学习 深度学习 损失函数

华为云助力制造企业解锁数字化转型困局

YG科技

华为云场景化解决方案 助力制造业企业数字化转型

YG科技

IDEA导入多模块maven项目时部分模块未成功加载

redcoder54

IDEA springboot

早有尔闻 | 低碳赋能,创新发展

Openlab_cosmoplat

工业互联网 开源社区

百度CTO王海峰做客《中国经济大讲堂》:文心一言,读书破万亿

飞桨PaddlePaddle

飞桨 文心一言

JDK8到JDK17有哪些吸引人的新特性?

京东科技开发者

Java jdk8 jdk17 java 8 的新特性 企业号 4 月 PK 榜

【倒计时4天】金融服务用户体验专场沙龙开启预约

易观分析

金融 经济

小白福利 | Window前言

GreatSQL

MySQL greatsql greatsql社区

Java如何实现手动连接数据库(mysql或oracle)|超级详细,建议收藏

bug菌

MySQL oracle 三周年连更

InfluxDB vs TDengine,用数据“说”性能

TDengine

大数据 tdengine Influxdb 时序数据库 InfluxDB Cluster

浅谈离线数据倾斜

京东科技开发者

hive sql 数据倾斜 Spark java 企业号 4 月 PK 榜

轻医美面部抗衰品牌“娅蔻”宣布将进军江苏市场

科技热闻

如何设计一个几十万在线用户弹幕系统

做梦都在改BUG

前端面试题之性能优化大杂烩

肥晨

三周年连更

打破制造业数字化转型困境:华为云助力企业填补数据空白和简化管理

YG科技

Fabarta 获过亿元人民币 Pre-A 轮融资,打造面向 AI 的图智能 Infra

Fabarta

软件复杂度的思考与解决之道

阿里技术

技术成长 软件复杂度

MySQL锁系统总结_架构_360技术_InfoQ精选文章