MySQL 索引使用什么数据结构?为什么用 B+做索引?
使用B+树。
-
如果是用AVL平衡二叉树,树高度太高,索引查询需要访问磁盘,每次访问以节点为单位进行磁盘I/O ,需要尽量减少数据读取的I/O操作,所以树高度一定不能太高,存储千万级别的数据,实践中 B+ 树的高度也就 4或者5。
-
B+树经常用来比较的是B树,B+树相比B树有个很大的特点是B+树所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的,对于范围查找,比如15~50,B树需要中序遍历二叉树,但是B+树直接在叶子节点顺序访问就可以了。
什么是最左匹配原则?
我们查询的where 条件如果只传入了班级,是走不到联合索引的,但是如果只传了学院编号,是可能会走到联合索引的。(为什么说可能,MYSQL的执行计划和查询的实际执行过程并不完全吻合,比如你数据库数据量很少,可能直接全量遍历速度更快,就不走索引了)
在建表的时候如何设计索引的?有没有做过索引优化 ?
-
如果我们select 获取的字段是学号,直接在手机号的索引表就能获取到数据,不需要回表;
-
如果我们select 的时候还有其他字段,我们查询的时候流程是这样的,先根据手机号查到学号,再根据学号去主键索引表查询数据,这个过程叫回表。
2、业务上具有唯一特性的字段,即使是组合字段,也建议建成唯一索引。说明:不要以为唯一索引影响了insert速度,这个速度损耗可以忽略,但提高查找速度是明显的;另外,即使在应用层做了非常完善的校验和控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生。
-
1)const 单表中最多只有一个匹配行(主键或者唯一索引),在优化阶段即可读取到数据。
-
2)ref 指的是使用普通的索引。(normal index)
-
3)range 对索引进行范围检索。反例:explain表的结果,type=index,索引物理文件全扫描,速度非常慢,这个index级别比较range还低,与全表扫描是小巫见大巫。
8、防止因字段类型不同造成的隐式转换,导致索引失效。
MyBatis用过吗? 一二级缓存清楚吗?
-
一级缓存 Mybatis的一级缓存是指SQLSession,一级缓存的作用域是SQlSession, Mabits默认开启一级缓存。在同一个SqlSession中,执行相同的SQL查询时;第一次会去查询数据库,并写在缓存中,第二次会直接从缓存中取。当执行SQL时候两次查询中间发生了增删改的操作,则SQLSession的缓存会被清空。每次查询会先去缓存中找,如果找不到,再去数据库查询,然后把结果写到缓存中。Mybatis的内部缓存使用一个HashMap,key为hashcode+statementId+sql语句。Value为查询出来的结果集映射成的java对象。SqlSession执行insert、update、delete等操作commit后会清空该SQLSession缓存。
-
二级缓存 二级缓存是 mapper级别的,Mybatis默认是没有开启二级缓存的。第一次调用mapper下的SQL去查询用户的信息,查询到的信息会存放在该mapper对应的二级缓存区域。第二次调用namespace下的mapper映射文件中,相同的sql去查询用户信息,会去对应的二级缓存内取结果。
MySQL 主从同步怎么做的?binlog清楚吗?
-
Master 数据库只要发生变化,立马记录到Binary log 日志文件中
-
Slave数据库启动一个I/O thread连接Master数据库,请求Master变化的二进制日志
-
Slave I/O获取到的二进制日志,保存到自己的Relay log 日志文件中。
-
Slave 有一个 SQL thread定时检查Realy log是否变化,变化那么就更新数据
MySQL 有没有做分库分表?怎么设计的?
拆分中间件,详细可以参考:
-
Sharding-sphere,前身是sharding-jdbc;当当的分库分表中间件
-
TDDL:jar,Taobao Distribute Data Layer;
-
Mycat:中间件。
注:工具的利弊,请自行调研,官网和社区优先。
-
按照userId纬度拆分,安琪拉见过的常见的有,根据 userId % 64 取模拆0~63编号的64张表,
-
固定位拆,取userId 指定二位,例如倒数2,3位组成00~99 一共100张表的,百库表表。
-
hash: userId hash一下,然后 % 表数;
-
Range: 另外还有按照userId 指定范围拆的,0-1千万一张表,这种用的比较少,容易产生热点。
-
把不同业务域的表拆成不同库,例如订单相关表、用户信息相关表、营销相关表分开在不同库;
-
把大字段独立存储到一张表中
-
把不常用的字段单独拿出来存储到一张表
用userId做的分库分表,现在需要用电话号码查询怎么办?
和回表逻辑一样,单独建一个电话号码索引表,存放电话号码和userId,查询时先根据电话号码查询userId,然后再根据userId查询数据。
- END -
如果看到这里,说明你喜欢这篇文章,请 转发、点赞。微信搜索「web_resource」,关注后回复「进群」或者扫描下方二维码即可进入无广告交流群。
↓扫描二维码进群↓
本文分享自微信公众号 - Java后端(web_resource)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。