news 2026/5/27 17:53:07

MySQL索引核心:聚集索引与非聚集索引

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MySQL索引核心:聚集索引与非聚集索引

前言

在学习MySQL过程中,阅读到这样一段话:在 MySQL 中,B+ 树索引按照存储方式的不同分为聚集索引和非聚集索引。我就在想为什么要分为这两种,下面我就详细介绍这两者的联系、优缺点。

一、聚集索引和非聚集索引的本质

  1. 聚集索引
    核心是“数据即索引,索引即数据”:
    • nnoDB 中,表的存储结构本身就是聚集索引的结构,表的所有行数据,都会按照聚集索引的键值(默认是主键)进行排序,存储在聚集索引的叶子节点中。
    • 可以把它理解成:一本按页码(主键)排序的书,书的每一页(叶子节点)就是完整的内容(整行数据)。
  2. 非聚集索引
    是“单独的索引结构,指向数据的指针”:
    • 非聚集索引有自己独立的索引树结构,叶子节点中只存储「索引列的值 + 聚集索引的键值(主键)」,并不存储整行数据。
    • 可以把它理解成:这本书的目录,目录里只记录章节名(索引列)和对应的页码(主键),不记录章节的具体内容。

二、聚集索引和非聚集索引的联系

二者是强绑定的,InnoDB 的设计逻辑里,非聚集索引完全依赖聚集索引:

  1. 非聚集索引的叶子节点,必须存储聚集索引的键值
    InnoDB 的非聚集索引,叶子节点不会直接存储数据的物理地址,而是存储聚集索引的主键值 —— 这是为了保证数据的稳定性(如果数据发生页分裂,物理地址会变化,但主键不会变)
  2. 非聚集索引的回表操作,本质是依赖聚集索引
    当非聚集索引无法覆盖查询(查询字段不在非聚集索引中)时,会先通过非聚集索引找到主键值,再用主键值去聚集索引中查询完整数据,这个过程就是「回表」
  3. 二者的索引树结构逻辑一致
    不管是聚集还是非聚集索引,都采用 B + 树的结构:非叶子节点存储索引键值用于导航,叶子节点存储实际的内容(聚集索引存数据,非聚集索引存索引列 + 主键)

三、优缺点对比

对比维度聚集索引非聚集索引
叶子节点存储存储整行数据存储索引列的值+聚集索引的主键值
索引体积体积大(等于表的实际数据体积)体积小(仅包含索引列和主键,远小于表体积)
访问效率1. 主键查询/范围查询效率极高 2.非主键查询效率极低(需要全表扫描)1. 非主键查询(匹配索引列)效率极高 2.覆盖索引场景下,效率优于聚集索引 3.非覆盖场景需回表,效率略降
排序特性天然按主键排序,无需额外排序可按索引列排序,避免ORDER BY触发的文件排序
创建限制1. 一张表仅能创建1个聚集索引 2.默认以主键为聚集索引;无主键则选唯一非空索引;否则生成隐藏rowid1. 一张表可创建多个非聚集索引 2.支持基于任意字段/联合字段创建
更新代价更新主键(聚集索引键)会导致整行数据移动,代价极高更新索引列仅修改索引树节点,代价低;若索引列是主键,会联动修改所有非聚集索引

四、实战案例

我们用一个电商的订单表(order_info)来举例,表结构如下:

CREATETABLE`order_info`(`order_id`BIGINTNOTNULLCOMMENT'订单ID(主键,聚集索引)',`user_id`BIGINTNOTNULLCOMMENT'用户ID',`order_time`DATETIMENOTNULLCOMMENT'下单时间',`order_amount`DECIMAL(10,2)NOTNULLCOMMENT'订单金额',`order_status`TINYINTNOTNULLCOMMENT'订单状态',PRIMARYKEY(`order_id`),-- 聚集索引KEY`idx_user_time`(`user_id`,`order_time`)-- 非聚集联合索引)ENGINE=InnoDBDEFAULTCHARSET=utf8mb4;

场景 1:适合用聚集索引的场景
如果运营需要查询「订单 ID 为 100001 的订单的所有信息」,SQL 如下:

SELECT*FROMorder_infoWHEREorder_id=100001;
  • 此时用聚集索引(order_id)是最优选择:直接通过主键定位到叶子节点的整行数据,不需要任何额外操作,效率最高

场景 2:适合用非聚集索引(覆盖索引)的场景
如果运营需要查询「用户 ID 为 1001 的所有订单的下单时间和订单金额」,SQL 如下:

SELECTorder_time,order_amountFROMorder_infoWHEREuser_id=1001;
  • 此时我们创建的非聚集联合索引idx_user_time (user_id, order_time),加上 InnoDB 默认存储的主键order_id,但我们的查询字段是order_time和order_amount—— 这里可以优化索引,改成idx_user_time_amount (user_id, order_time, order_amount)
  • 优化后,这个索引就覆盖了查询的所有字段,MySQL 直接从非聚集索引中返回数据,不需要回表,效率远高于用聚集索引查询

场景 3:适合用非聚集索引(需要回表)的场景
如果运营需要查询「用户 ID 为 1001 的所有订单的完整信息」,SQL 如下:

SELECT*FROMorder_infoWHEREuser_id=1001;
  • 此时非聚集索引idx_user_time只能提供user_id、order_time和order_id,无法覆盖所有字段,需要回表:
    1.先通过idx_user_time找到所有user_id=1001的行,拿到对应的order_id
    2.再用order_id去聚集索引中查询整行数据
  • 但这个效率依然远高于用聚集索引全表扫描(聚集索引只能按 order_id 排序,无法快速找到 user_id=1001 的行)

五、实战建议

  1. 聚集索引的选择:尽量用自增主键
    自增主键的插入是顺序的,不会导致聚集索引的页分裂,插入效率更高;如果用 UUID 作为主键,插入时会随机定位位置,导致大量页分裂,性能下降
  2. 非聚集索引的设计:优先考虑覆盖索引
    对于高频查询,尽量创建包含查询所需所有字段的联合索引,避免回表
  3. 不要滥用非聚集索引
    非聚集索引会占用额外的磁盘空间,同时会降低插入 / 更新 / 删除的效率(因为需要维护索引树),只给高频查询的字段创建索引
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 14:29:11

Linly-Talker支持语音唤醒功能吗?类似Siri体验

Linly-Talker 能否实现“说一句就醒”的语音唤醒体验? 在智能音箱普及的今天,我们早已习惯了对设备喊一声“嘿 Siri”或“小爱同学”,就能立刻唤醒一个随时待命的数字助手。这种“始终在线、听觉优先”的交互方式,正悄然成为人机沟…

作者头像 李华
网站建设 2026/5/25 19:44:15

DeepSeek-V3.1:混合思维模式提升效率与智能

DeepSeek-V3.1:混合思维模式提升效率与智能 【免费下载链接】DeepSeek-V3.1-Base-BF16 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/DeepSeek-V3.1-Base-BF16 大语言模型领域再迎新突破——DeepSeek-V3.1正式发布,通过创新的混合思维模…

作者头像 李华
网站建设 2026/5/27 14:33:18

Emu3.5:原生多模态模型的世界建模革命

导语:BAAI团队推出的Emu3.5模型以"统一世界建模"为核心,通过原生多模态架构和创新推理技术,重新定义了AI理解与生成视觉-文本内容的能力边界。 【免费下载链接】Emu3.5 项目地址: https://ai.gitcode.com/BAAI/Emu3.5 行业…

作者头像 李华
网站建设 2026/5/26 15:06:45

41、PowerShell实用扩展与事件处理

PowerShell实用扩展与事件处理 1. PowerShell社区扩展(PSCX) 1.1 活动目录用户删除 作为域管理员,在活动目录中删除用户时需格外小心。例如,删除名为 ADSITEST2 的用户,可使用以下命令: PS> del ADSITEST2 PS> 需要注意的是,此操作不会有确认提示,所以操作…

作者头像 李华
网站建设 2026/5/27 2:34:32

Linly-Talker支持WebSocket双向通信吗?

Linly-Talker 的实时交互架构:WebSocket 是否不可或缺? 在智能对话系统日益普及的今天,用户早已不再满足于“输入问题、等待回复”的静态交互模式。无论是企业客服、在线教育,还是虚拟主播和数字员工,人们对低延迟、高…

作者头像 李华
网站建设 2026/5/26 20:55:08

Linly-Talker能否生成儿童音色?亲子教育场景潜力巨大

Linly-Talker能否生成儿童音色?亲子教育场景潜力巨大 在智能教育设备日益普及的今天,越来越多家庭开始期待AI不仅能“讲知识”,还能“像人一样陪伴孩子成长”。尤其对于3-6岁的幼儿而言,语言风格、声音特质和表情互动直接影响他们…

作者头像 李华