MySQL中B+树索引的深入解析
一、索引的减少I/O设计
1. 读取量相关
当从硬盘中搜索并读取查询记录时,由于硬盘单次读取数据到内存的时间远高于内存内操作数据的时间,MySQL通过对索引数据结构的设计来减少查询记录时的硬盘I/O次数。每个B+搜索树节点的存储空间对应硬盘的一个页,这样能最大程度利用硬盘单次读取的页容量,减少读取次数。
2. 搜索树特性
2.1 搜索方向
在搜索树中进行查询时,会朝着正确范围且符合正向增长概率的方向进行搜索,避免无效遍历,最终能精确匹配目标记录。
2.2 有序性
搜索树结构保证了记录值依据字段键的有序排列,这使得能够通过字段进行范围查询以及排序操作。与哈希表对比,哈希表虽能实现O(1)的精确查询,但内部是无序数组,无法进行范围查询和排序。
3. 多叉结构分析
3.1 B树的局限
B树以键值对为单位存储,然而在数据库场景下,值记录空间较大而键字段空间较小,导致单个节点能存储的键值对有限,向下分支少,树高较高,使得硬盘I/O次数增多,且查询时间开销不稳定,因为值记录可能分布在非叶子和叶子节点,读取效率不一致。
3.2 B+树的优势
B+树将键与值分开存储,非叶子节点仅存储搜索字段,能大量排布键字段,实现高效的分叉搜索。非叶子节点的字段总量较小可缓存到内存,首次查询时通过B+树高度次硬盘读取加载非叶子节点到缓存,后续查询可在缓存中快速搜索,时间复杂度低。非叶子节点在区间搜索时会向下保留区间键,叶子节点存储全集键值对且通过链表物理连续连接,保证了范围查询的高效性,且查询固定在叶子节点进行,时间开销稳定。
二、索引的操作
1. 查看
可通过以下语句查看表的索引:
show index from tb_name;
show create table tb_name;
用于查看表中所有的索引信息。
2. 创建索引
2.1 创建时机
建议在表数据为空或数据量较小时创建索引,此时创建索引对性能影响较小。
2.2 大表索引创建
2.2.1 直接创建过程
为记录量大的表创建索引时,B+树按1000次方的节点数量向下构建。从顶层根节点开始,每层节点按1000个键字段分叉,逐步构建直到叶子节点覆盖所有字段全集。
2.2.2 危险性
直接为海量数据的表创建索引会导致服务器短时间大量资源用于构建索引,可能出现挂机状态。
2.2.3 正确创建做法
若需为海量数据的表创建索引,可在另一台MySQL服务器创建相同结构空表并创建索引,控制数据量导入建树,完成后切换服务器使用。
3. 删除索引
通过以下语句删除表中的指定索引:
drop index idx_name on tb_name;
用于删除表中的指定索引
文章整理自互联网,只做测试使用。发布者:Lomu,转转请注明出处:https://www.it1024doc.com/12959.html