多列索引:处理复杂查询条件的利器

多列索引的基本概念与创建

多列索引是指在表的多个列上共同创建的索引,用于优化包含多列条件的查询(如WHERE col1 = ? AND col2 = ?)。PostgreSQL支持在B-tree、GiST、GIN、BRIN这四类索引上创建多列索引,语法如下:

-- 创建多列B-tree索引(最常用)
CREATE INDEX 索引名 ON 表名 (列1, 列2, ...);

例子:假设你有一张存储设备信息的表test2,结构如下:

CREATE TABLE test2 (
  major int,  -- 主设备号
  minor int,  -- 次设备号
  name varchar -- 设备名称(如"/dev/sda1")
);

频繁执行查询SELECT name FROM test2 WHERE major = 8 AND minor = 1;(查询主设备号8、次设备号1的设备名称)。此时创建多列索引test2_mm_idx可以高效定位到目标行:

CREATE INDEX test2_mm_idx ON test2 (major, minor);

不同索引类型的多列支持与效率

多列索引的效率取决于索引类型列的顺序,以下是各类索引的特点:

  1. B-tree索引(最常用)

    • 遵循左前缀原则:只有当查询条件包含索引的前N列时,索引才能高效扫描。例如test2_mm_idx (major, minor)
      • 支持WHERE major = 8(使用前1列)、WHERE major = 8 AND minor = 1(使用前2列);
      • 不支持WHERE minor = 1(缺少左前缀major),此时索引扫描等同于全表扫描,效率极低。
    • 适合:多列等值查询等值+范围查询(如major = 8 AND minor > 5)。
  2. GiST索引

    • 首列(左起第一列)的选择性至关重要:如果首列的distinct值很少(如性别列),即使后面的列选择性高,索引效率也会很差。
    • 适合:空间数据(如pointpolygon)的多列查询(如WHERE location @> 'POINT(10 20)' AND category = 'shop')。
  3. GIN索引

    • 无左前缀限制:任意列的条件都能高效使用索引。例如CREATE INDEX idx ON docs (title, content)(GIN索引),WHERE title @@ 'PostgreSQL'WHERE content @@ 'index'的效率相同。
    • 适合:数组、JSONB等多值类型的查询(如WHERE tags @> '{"database"}' AND author = 'Alice')。
  4. BRIN索引

    • 无左前缀限制:任意列的条件效率相同。
    • 适合:大表(如TB级)的范围查询(如时间序列表的WHERE create_time BETWEEN '2023-01-01' AND '2023-12-31' AND region = 'China')。

多列索引的使用技巧与限制

  • 适用场景:仅当查询频繁使用多列组合条件时创建,例如电商的“分类+品牌”查询、日志的“时间+级别”查询。
  • 限制
    • 多列索引最多支持32列(可通过编译PostgreSQL修改,但不建议);
    • 超过3列的索引很少有用(空间占用大、维护成本高);
    • 避免将低选择性列(如性别、状态)作为首列(B-tree/GiST索引),否则索引扫描范围过大。

覆盖索引与仅索引扫描:避免回表的关键

仅索引扫描的工作原理

PostgreSQL的索引是二级索引(索引与表数据分开存储),普通索引扫描需要两步:

  1. 从索引中找到符合条件的行指针(ctid,指向表堆的物理位置);
  2. 回表:通过行指针从表堆中读取完整行数据。

而**仅索引扫描(Index-Only Scan)**可以跳过回表,直接从索引中获取所有需要的数据——前提是:

  1. 索引包含查询需要的所有列(即覆盖索引);
  2. **可见性映射(Visibility Map)**标记对应表堆页为“全可见”(即页内所有行对当前事务可见,无需检查行的可见性)。

可见性映射是PostgreSQL的核心优化:它记录了表堆中每个页的“全可见”状态(1 bit/页)。如果页是全可见的,仅索引扫描可以直接返回索引中的数据,无需回表。

如何创建覆盖索引

覆盖索引的核心是包含查询所需的所有列,PostgreSQL提供两种方式:

1. 传统方式:将所有列作为索引列

-- 覆盖查询`SELECT product_name FROM products WHERE category_id = 1 AND brand_id = 101`
CREATE INDEX products_cat_brand_name_idx ON products (category_id, brand_id, product_name);
  • 缺点:product_name作为索引列会增加索引的宽度,影响上层索引页的存储效率;如果需要category_id + brand_id的唯一性约束,这种方式无法实现(因为product_name会破坏唯一性)。

2. 推荐方式:使用INCLUDE clause(PostgreSQL 11+)

INCLUDE用于添加非键列(payload列),这些列不参与索引的搜索,仅作为“附加数据”存储在索引中。语法如下:

CREATE INDEX 索引名 ON table (键列1, 键列2, ...) INCLUDE (非键列列表);

例子:优化上述查询,创建覆盖索引:

-- 键列:category_id、brand_id(用于定位行);非键列:product_name(用于返回结果)
CREATE INDEX products_cat_brand_name_idx ON products (category_id, brand_id) INCLUDE (product_name);

覆盖索引的最佳实践

  1. 优先使用INCLUDE
    • 非键列不会出现在B-tree的上层索引页,减少索引的存储空间和扫描时间;
    • 在键列上创建UNIQUE约束时,非键列不会影响唯一性(例如CREATE UNIQUE INDEX idx ON users(email) INCLUDE(name),确保email唯一,同时包含name)。

例子:用户表的唯一约束与覆盖索引:
需求:确保email唯一,且频繁查询SELECT name FROM users WHERE email = '[email protected]'

-- 正确:用INCLUDE创建覆盖索引,同时保证email唯一
CREATE UNIQUE INDEX users_email_name_idx ON users (email)INCLUDE (name);

-- 错误:传统方式无法保证email唯一(因为name会被包含在索引键中)
CREATE UNIQUE INDEX users_email_name_idx ON users (email, name);
  1. 避免冗余列

    • 仅包含查询必须返回的列,不要添加无关列(会增加索引大小,降低效率)。例如查询SELECT total_amount FROM orders WHERE user_id = 123,只需INCLUDE (total_amount),无需添加status列。
  2. 注意可见性映射

    • 仅索引扫描的优势取决于全可见页的比例。如果表频繁更新(如订单表),全可见页很少,仅索引扫描的效率提升有限;
    • 对于静态表(如数据仓库的维度表),全可见页比例高,覆盖索引的效果最好。

课后Quiz:巩固与实践

问题:优化订单查询

假设你有一张订单表orders

CREATE TABLE orders (
    order_id serial PRIMARY KEY,
    user_id int,
    order_date date,
    total_amount numeric(10,2),
    status varchar(50)
);

频繁执行的查询是:

SELECT total_amount FROM orders WHERE user_id = 123 AND order_date BETWEEN '2023-01-01' AND 'job5';

请回答以下问题:

  1. 如何创建索引优化该查询?写出SQL语句。(提示:覆盖索引+多列B-tree)
  2. 为什么用INCLUDE而不是传统方式?

答案解析

问题1:索引创建语句(覆盖+多列B-tree)

CREATE INDEX orders_user_date_total_idx ON orders (user_id, order_date) INCLUDE (total_amount);

理由

  • user_id(等值查询)作为首列,order_date(范围查询)作为第二列,符合B-tree的左前缀原则;
  • INCLUDE (total_amount)覆盖查询需要返回的列,实现仅索引扫描。

问题2:INCLUDE的优势

  1. 唯一性支持:如果未来需要user_id + order_date的唯一约束(防止重复订单),可以修改为:
    CREATE UNIQUE INDEX orders_user_date_total_idx ON orders (user_id, order_date) INCLUDE (total_amount);
    
    传统方式(user_id, order_date, total_amount)无法实现,因为total_amount会破坏唯一性。
  2. 索引效率total_amount作为非键列,不会出现在B-tree的上层索引页,减少索引的存储空间和扫描时间。

常见报错解决方案

报错1:ERROR: syntax error at or near "INCLUDE"

原因

  • 使用了不支持INCLUDE的索引类型(如GIN、BRIN);
  • PostgreSQL版本低于11(INCLUDE是11及以上版本的特性)。

解决办法

  • 更换索引类型:B-tree、GiST、SP-GiST支持INCLUDE
  • 升级PostgreSQL到11+。

报错2:ERROR: included column "upper(product_name)" must be a simple column reference

原因INCLUDE不支持表达式列(如upper(product_name)price * 0.8)。

解决办法

  • 将表达式作为索引列(适合表达式查询):
    CREATE INDEX products_name_upper_idx ON products (category_id, upper(product_name));
    
  • 或包含原始列,在查询中计算表达式:
    -- 索引包含原始列`product_name`
    CREATE INDEX products_cat_brand_name_idx ON products (category_id, brand_id) INCLUDE (product_name);
    -- 查询中计算表达式
    SELECT upper(product_name) FROM products WHERE category_id = 1 AND brand_id = 101;
    

报错3:ERROR: index "idx_name" does not support covering indexes

原因:使用了不支持覆盖索引的索引类型(如Hash索引)。

解决办法:更换为支持覆盖索引的类型(如B-tree)。

参考链接:

  • 多列索引:www.postgresql.org/docs/17/ind…
  • 覆盖索引与仅索引扫描:www.postgresql.org/docs/17/ind…
往期文章归档
  • 只给表子集建索引?用函数结果建索引?PostgreSQL这俩操作凭啥能省空间又加速? - cmdragon's Blog
  • B-tree索引像字典查词一样工作?那哪些数据库查询它能加速,哪些不能? - cmdragon's Blog
  • 想抓PostgreSQL里的慢SQL?pg_stat_statements基础黑匣子和pg_stat_monitor时间窗,谁能帮你更准揪出性能小偷? - cmdragon's Blog
  • PostgreSQL的“时光机”MVCC和锁机制是怎么搞定高并发的? - cmdragon's Blog
  • PostgreSQL性能暴涨的关键?内存IO并发参数居然要这么设置? - cmdragon's Blog
  • 大表查询慢到翻遍整个书架?PostgreSQL分区表教你怎么“分类”才高效
  • PostgreSQL 查询慢?是不是忘了优化 GROUP BY、ORDER BY 和窗口函数? - cmdragon's Blog
  • PostgreSQL里的子查询和CTE居然在性能上“掐架”?到底该站哪边? - cmdragon's Blog
  • PostgreSQL选Join策略有啥小九九?Nested Loop/Merge/Hash谁是它的菜? - cmdragon's Blog
  • PostgreSQL新手SQL总翻车?这7个性能陷阱你踩过没? - cmdragon's Blog
  • PostgreSQL索引选B-Tree还是GiST?“瑞士军刀”和“多面手”的差别你居然还不知道? - cmdragon's Blog
  • 想知道数据库怎么给查询“算成本选路线”?EXPLAIN能帮你看明白? - cmdragon's Blog
  • PostgreSQL处理SQL居然像做蛋糕?解析到执行的4步里藏着多少查询优化的小心机? - cmdragon's Blog
  • PostgreSQL备份不是复制文件?物理vs逻辑咋选?误删还能精准恢复到1分钟前? - cmdragon's Blog
  • 转账不翻车、并发不干扰,PostgreSQL的ACID特性到底有啥魔法? - cmdragon's Blog
  • 银行转账不白扣钱、电商下单不超卖,PostgreSQL事务的诀窍是啥? - cmdragon's Blog
  • PostgreSQL里的PL/pgSQL到底是啥?能让SQL从“说目标”变“讲步骤”? - cmdragon's Blog
  • PostgreSQL视图不存数据?那它怎么简化查询还能递归生成序列和控制权限? - cmdragon's Blog
  • PostgreSQL索引这么玩,才能让你的查询真的“飞”起来? - cmdragon's Blog
  • PostgreSQL的表关系和约束,咋帮你搞定用户订单不混乱、学生选课不重复? - cmdragon's Blog
  • PostgreSQL查询的筛子、排序、聚合、分组?你会用它们搞定数据吗? - cmdragon's Blog
  • PostgreSQL数据类型怎么选才高效不踩坑? - cmdragon's Blog
  • 想解锁PostgreSQL查询从基础到进阶的核心知识点?你都get了吗? - cmdragon's Blog
  • PostgreSQL DELETE居然有这些操作?返回数据、连表删你试过没? - cmdragon's Blog
  • PostgreSQL UPDATE语句怎么玩?从改邮箱到批量更新的避坑技巧你都会吗? - cmdragon's Blog
  • PostgreSQL插入数据还在逐条敲?批量、冲突处理、返回自增ID的技巧你会吗? - cmdragon's Blog
  • PostgreSQL的“仓库-房间-货架”游戏,你能建出电商数据库和表吗? - cmdragon's Blog
  • PostgreSQL 17安装总翻车?Windows/macOS/Linux避坑指南帮你搞定? - cmdragon's Blog
  • 能当关系型数据库还能玩对象特性,能拆复杂查询还能自动管库存,PostgreSQL凭什么这么香? - cmdragon's Blog
  • 给接口加新字段又不搞崩老客户端?FastAPI的多版本API靠哪三招实现? - cmdragon's Blog
  • 流量突增要搞崩FastAPI?熔断测试是怎么防系统雪崩的? - cmdragon's Blog
  • FastAPI秒杀库存总变负数?Redis分布式锁能帮你守住底线吗 - cmdragon's Blog
  • FastAPI的CI流水线怎么自动测端点,还能让Allure报告美到犯规? - cmdragon's Blog
  • 如何用GitHub Actions为FastAPI项目打造自动化测试流水线? - cmdragon's Blog
  • 如何用Git Hook和CI流水线为FastAPI项目保驾护航? - cmdragon's Blog
  • FastAPI如何用契约测试确保API的「菜单」与「菜品」一致?
  • 为什么TDD能让你的FastAPI开发飞起来? - cmdragon's Blog
  • 如何用FastAPI玩转多模块测试与异步任务,让代码不再“闹脾气”? - cmdragon's Blog
  • 如何在FastAPI中玩转“时光倒流”的数据库事务回滚测试?
  • 如何在FastAPI中优雅地模拟多模块集成测试? - cmdragon's Blog
  • 多环境配置切换机制能否让开发与生产无缝衔接? - cmdragon's Blog
  • 如何在 FastAPI 中巧妙覆盖依赖注入并拦截第三方服务调用? - cmdragon's Blog
  • 为什么你的单元测试需要Mock数据库才能飞起来? - cmdragon's Blog
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼? - cmdragon's Blog
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼? - cmdragon's Blog
  • 测试覆盖率不够高?这些技巧让你的FastAPI测试无懈可击! - cmdragon's Blog
  • 为什么你的FastAPI测试覆盖率总是低得让人想哭? - cmdragon's Blog
  • 如何让FastAPI测试不再成为你的噩梦? - cmdragon's Blog
  • FastAPI测试环境配置的秘诀,你真的掌握了吗? - cmdragon's Blog
  • 全链路追踪如何让FastAPI微服务架构的每个请求都无所遁形? - cmdragon's Blog
免费好用的热门在线工具
  • Mermaid 在线编辑器 - 应用商店 | By cmdragon
  • 数学求解计算器 - 应用商店 | By cmdragon
  • 智能提词器 - 应用商店 | By cmdragon
  • 魔法简历 - 应用商店 | By cmdragon
  • Image Puzzle Tool - 图片拼图工具 | By cmdragon
  • 字幕下载工具 - 应用商店 | By cmdragon
  • 歌词生成工具 - 应用商店 | By cmdragon
  • 网盘资源聚合搜索 - 应用商店 | By cmdragon
  • ASCII字符画生成器 - 应用商店 | By cmdragon
  • JSON Web Tokens 工具 - 应用商店 | By cmdragon
  • Bcrypt 密码工具 - 应用商店 | By cmdragon
  • GIF 合成器 - 应用商店 | By cmdragon
  • GIF 分解器 - 应用商店 | By cmdragon
  • 文本隐写术 - 应用商店 | By cmdragon
  • CMDragon 在线工具 - 高级AI工具箱与开发者套件 | 免费好用的在线工具
  • 应用商店 - 发现1000+提升效率与开发的AI工具和实用程序 | 免费好用的在线工具
  • CMDragon 更新日志 - 最新更新、功能与改进 | 免费好用的在线工具
  • 支持我们 - 成为赞助者 | 免费好用的在线工具
  • AI文本生成图像 - 应用商店 | 免费好用的在线工具
  • 临时邮箱 - 应用商店 | 免费好用的在线工具
  • 二维码解析器 - 应用商店 | 免费好用的在线工具
  • 文本转思维导图 - 应用商店 | 免费好用的在线工具
  • 正则表达式可视化工具 - 应用商店 | 免费好用的在线工具
  • 文件隐写工具 - 应用商店 | 免费好用的在线工具
  • IPTV 频道探索器 - 应用商店 | 免费好用的在线工具
  • 快传 - 应用商店 | 免费好用的在线工具
  • 随机抽奖工具 - 应用商店 | 免费好用的在线工具
  • 动漫场景查找器 - 应用商店 | 免费好用的在线工具
  • 时间工具箱 - 应用商店 | 免费好用的在线工具
  • 网速测试 - 应用商店 | 免费好用的在线工具
  • AI 智能抠图工具 - 应用商店 | 免费好用的在线工具
  • 背景替换工具 - 应用商店 | 免费好用的在线工具
  • 艺术二维码生成器 - 应用商店 | 免费好用的在线工具
  • Open Graph 元标签生成器 - 应用商店 | 免费好用的在线工具
  • 图像对比工具 - 应用商店 | 免费好用的在线工具
  • 图片压缩专业版 - 应用商店 | 免费好用的在线工具
  • 密码生成器 - 应用商店 | 免费好用的在线工具
  • SVG优化器 - 应用商店 | 免费好用的在线工具
  • 调色板生成器 - 应用商店 | 免费好用的在线工具
  • 在线节拍器 - 应用商店 | 免费好用的在线工具
  • IP归属地查询 - 应用商店 | 免费好用的在线工具
  • CSS网格布局生成器 - 应用商店 | 免费好用的在线工具
  • 邮箱验证工具 - 应用商店 | 免费好用的在线工具
  • 书法练习字帖 - 应用商店 | 免费好用的在线工具
  • 金融计算器套件 - 应用商店 | 免费好用的在线工具
  • 中国亲戚关系计算器 - 应用商店 | 免费好用的在线工具
  • Protocol Buffer 工具箱 - 应用商店 | 免费好用的在线工具
  • IP归属地查询 - 应用商店 | 免费好用的在线工具
  • 图片无损放大 - 应用商店 | 免费好用的在线工具
  • 文本比较工具 - 应用商店 | 免费好用的在线工具
  • IP批量查询工具 - 应用商店 | 免费好用的在线工具
  • 域名查询工具 - 应用商店 | 免费好用的在线工具
  • DNS工具箱 - 应用商店 | 免费好用的在线工具
  • 网站图标生成器 - 应用商店 | 免费好用的在线工具
  • XML Sitemap
本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]