MySQL 的 InnoDB 引擎中聚簇索引和非聚簇索引

dj_master

已于 2025-06-19 15:49:13 修改

阅读量576

点赞数 10

CC 4.0 BY-SA版权

分类专栏： MySql 文章标签： mysql 数据库

于 2025-06-18 10:53:08 首次发布

49 篇文章

订阅专栏

在 MySQL 的 InnoDB 引擎中，聚簇索引（Clustered Index）和非聚簇索引（Non - Clustered Index，也叫二级索引、辅助索引）是索引体系的核心，二者在存储结构、查询逻辑、适用场景等方面差异显著，以下从底层原理到实际影响详细拆解：

定义：InnoDB 中，聚簇索引的叶子节点直接存储完整的数据行（即表记录的物理存储与索引结构融合）。
存储结构：
- 叶子节点包含主键值 + 所有字段数据（如 id + name + age + … ）。
- 非叶子节点存主键值和子节点指针，用于快速定位叶子节点。
- 一张表只能有一个聚簇索引（默认是主键索引；若表无主键，选唯一非空索引；若都没有，InnoDB 会隐式创建一个 6 字节的 row_id 作为聚簇索引）。

定义：非聚簇索引的叶子节点存储“索引键值 + 主键值”，不存完整数据行，需通过主键回表查询完整数据。
存储结构：
- 叶子节点包含索引键值（如 name ） + 主键值（如 id ）。
- 非叶子节点存索引键值和子节点指针，用于定位叶子节点。
- 一张表可以有多个非聚簇索引（如对 name、age 分别建索引）。

假设表 user 结构：id（主键，聚簇索引）、name（二级索引）、age 等字段。

若查询条件是 WHERE id = 1（主键，走聚簇索引）：
1. 从聚簇索引的根节点开始，通过二分查找定位到 id = 1 的叶子节点。
2. 叶子节点直接存完整数据行（id=1 + name=Alice + age=20 + … ），直接返回结果，无需额外操作。

若查询条件是 WHERE name = 'Alice'（name 是二级索引）：
1. 从 name 二级索引的根节点开始，二分查找定位到 name = 'Alice' 的叶子节点。
2. 叶子节点拿到对应的主键值（如 id = 1 ）。
3. 回表：用主键值 id = 1 到聚簇索引中查找，定位到聚簇索引的叶子节点，获取完整数据行（id=1 + name=Alice + age=20 + … ）。
4. 返回完整数据行给 Server 层。

聚簇索引优势：主键查询（如 WHERE id = ? ）直接命中数据，无需回表，效率极高。
非聚簇索引劣势：二级索引查询需回表，多一次 IO（若缓冲池未缓存聚簇索引页），性能比聚簇索引查询低。但可通过覆盖索引优化（若查询字段都在二级索引中，无需回表）。

主键选择：优先用自增主键（如 BIGINT AUTO_INCREMENT ），减少聚簇索引插入时的页分裂，提升写入性能。
二级索引设计：
- 避免冗余索引（如对 name 和 name, age 同时建索引），增加维护成本。
- 利用覆盖索引（如查询 name 和 age ，建 (name, age) 联合索引），减少回表。
- 对高频查询的非主键字段，合理建二级索引，平衡查询与写入性能。