您的位置: 首页> Trae

复杂查询总拖后腿？PostgreSQL多列索引+覆盖索引的神仙技巧你get没？

匿名上传

发布时间:2025-10-20 16:15:01

多列索引：处理复杂查询条件的利器

多列索引的基本概念与创建

多列索引是指在表的多个列上共同创建的索引，用于优化包含多列条件的查询（如WHERE col1 = ? AND col2 = ?）。PostgreSQL支持在B-tree、GiST、GIN、BRIN这四类索引上创建多列索引，语法如下：

-- 创建多列B-tree索引（最常用）
CREATE INDEX 索引名 ON 表名 (列1, 列2, ...);

例子：假设你有一张存储设备信息的表test2，结构如下：

CREATE TABLE test2 (
  major int,  -- 主设备号
  minor int,  -- 次设备号
  name varchar -- 设备名称（如"/dev/sda1"）
);

频繁执行查询SELECT name FROM test2 WHERE major = 8 AND minor = 1;（查询主设备号8、次设备号1的设备名称）。此时创建多列索引test2_mm_idx可以高效定位到目标行：

CREATE INDEX test2_mm_idx ON test2 (major, minor);

不同索引类型的多列支持与效率

多列索引的效率取决于索引类型和列的顺序，以下是各类索引的特点：

B-tree索引（最常用）
- 遵循左前缀原则：只有当查询条件包含索引的前N列时，索引才能高效扫描。例如test2_mm_idx (major, minor)：
  - 支持WHERE major = 8（使用前1列）、WHERE major = 8 AND minor = 1（使用前2列）；
  - 不支持WHERE minor = 1（缺少左前缀major），此时索引扫描等同于全表扫描，效率极低。
- 适合：多列等值查询或等值+范围查询（如major = 8 AND minor > 5）。
GiST索引
- 首列（左起第一列）的选择性至关重要：如果首列的distinct值很少（如性别列），即使后面的列选择性高，索引效率也会很差。
- 适合：空间数据（如point、polygon）的多列查询（如WHERE location @> 'POINT(10 20)' AND category = 'shop'）。
GIN索引
- 无左前缀限制：任意列的条件都能高效使用索引。例如CREATE INDEX idx ON docs (title, content)（GIN索引），WHERE title @@ 'PostgreSQL'或WHERE content @@ 'index'的效率相同。
- 适合：数组、JSONB等多值类型的查询（如WHERE tags @> '{"database"}' AND author = 'Alice'）。
BRIN索引
- 无左前缀限制：任意列的条件效率相同。
- 适合：大表（如TB级）的范围查询（如时间序列表的WHERE create_time BETWEEN '2023-01-01' AND '2023-12-31' AND region = 'China'）。

多列索引的使用技巧与限制

适用场景：仅当查询频繁使用多列组合条件时创建，例如电商的“分类+品牌”查询、日志的“时间+级别”查询。
限制：
- 多列索引最多支持32列（可通过编译PostgreSQL修改，但不建议）；
- 超过3列的索引很少有用（空间占用大、维护成本高）；
- 避免将低选择性列（如性别、状态）作为首列（B-tree/GiST索引），否则索引扫描范围过大。

覆盖索引与仅索引扫描：避免回表的关键

仅索引扫描的工作原理

PostgreSQL的索引是二级索引（索引与表数据分开存储），普通索引扫描需要两步：

从索引中找到符合条件的行指针（ctid，指向表堆的物理位置）；
回表：通过行指针从表堆中读取完整行数据。

而**仅索引扫描（Index-Only Scan）**可以跳过回表，直接从索引中获取所有需要的数据——前提是：

索引包含查询需要的所有列（即覆盖索引）；
**可见性映射（Visibility Map）**标记对应表堆页为“全可见”（即页内所有行对当前事务可见，无需检查行的可见性）。

可见性映射是PostgreSQL的核心优化：它记录了表堆中每个页的“全可见”状态（1 bit/页）。如果页是全可见的，仅索引扫描可以直接返回索引中的数据，无需回表。

如何创建覆盖索引

覆盖索引的核心是包含查询所需的所有列，PostgreSQL提供两种方式：

1. 传统方式：将所有列作为索引列

-- 覆盖查询`SELECT product_name FROM products WHERE category_id = 1 AND brand_id = 101`
CREATE INDEX products_cat_brand_name_idx ON products (category_id, brand_id, product_name);

缺点：product_name作为索引列会增加索引的宽度，影响上层索引页的存储效率；如果需要category_id + brand_id的唯一性约束，这种方式无法实现（因为product_name会破坏唯一性）。

2. 推荐方式：使用`INCLUDE` clause（PostgreSQL 11+）

INCLUDE用于添加非键列（payload列），这些列不参与索引的搜索，仅作为“附加数据”存储在索引中。语法如下：

CREATE INDEX 索引名 ON table (键列1, 键列2, ...) INCLUDE (非键列列表);

例子：优化上述查询，创建覆盖索引：

-- 键列：category_id、brand_id（用于定位行）；非键列：product_name（用于返回结果）
CREATE INDEX products_cat_brand_name_idx ON products (category_id, brand_id) INCLUDE (product_name);

覆盖索引的最佳实践

优先使用INCLUDE：
- 非键列不会出现在B-tree的上层索引页，减少索引的存储空间和扫描时间；
- 在键列上创建UNIQUE约束时，非键列不会影响唯一性（例如CREATE UNIQUE INDEX idx ON users(email) INCLUDE(name)，确保email唯一，同时包含name）。

例子：用户表的唯一约束与覆盖索引：
需求：确保email唯一，且频繁查询SELECT name FROM users WHERE email = '[email protected]'。

-- 正确：用INCLUDE创建覆盖索引，同时保证email唯一
CREATE UNIQUE INDEX users_email_name_idx ON users (email）INCLUDE (name);

-- 错误：传统方式无法保证email唯一（因为name会被包含在索引键中）
CREATE UNIQUE INDEX users_email_name_idx ON users (email, name);

避免冗余列：
- 仅包含查询必须返回的列，不要添加无关列（会增加索引大小，降低效率）。例如查询SELECT total_amount FROM orders WHERE user_id = 123，只需INCLUDE (total_amount)，无需添加status列。
注意可见性映射：
- 仅索引扫描的优势取决于全可见页的比例。如果表频繁更新（如订单表），全可见页很少，仅索引扫描的效率提升有限；
- 对于静态表（如数据仓库的维度表），全可见页比例高，覆盖索引的效果最好。

课后Quiz：巩固与实践

问题：优化订单查询

假设你有一张订单表orders：

CREATE TABLE orders (
    order_id serial PRIMARY KEY,
    user_id int,
    order_date date,
    total_amount numeric(10,2),
    status varchar(50)
);

频繁执行的查询是：

SELECT total_amount FROM orders WHERE user_id = 123 AND order_date BETWEEN '2023-01-01' AND 'job5';

请回答以下问题：

如何创建索引优化该查询？写出SQL语句。（提示：覆盖索引+多列B-tree）
为什么用INCLUDE而不是传统方式？

答案解析

问题1：索引创建语句（覆盖+多列B-tree）

CREATE INDEX orders_user_date_total_idx ON orders (user_id, order_date) INCLUDE (total_amount);

理由：

user_id（等值查询）作为首列，order_date（范围查询）作为第二列，符合B-tree的左前缀原则；
INCLUDE (total_amount)覆盖查询需要返回的列，实现仅索引扫描。

问题2：`INCLUDE`的优势

唯一性支持：如果未来需要user_id + order_date的唯一约束（防止重复订单），可以修改为：
```
CREATE UNIQUE INDEX orders_user_date_total_idx ON orders (user_id, order_date) INCLUDE (total_amount);
```
传统方式（user_id, order_date, total_amount）无法实现，因为total_amount会破坏唯一性。
索引效率：total_amount作为非键列，不会出现在B-tree的上层索引页，减少索引的存储空间和扫描时间。

常见报错解决方案

报错1：`ERROR: syntax error at or near "INCLUDE"`

原因：

使用了不支持INCLUDE的索引类型（如GIN、BRIN）；
PostgreSQL版本低于11（INCLUDE是11及以上版本的特性）。

解决办法：

更换索引类型：B-tree、GiST、SP-GiST支持INCLUDE；
升级PostgreSQL到11+。

报错2：`ERROR: included column "upper(product_name)" must be a simple column reference`

原因：INCLUDE不支持表达式列（如upper(product_name)、price * 0.8）。

解决办法：

将表达式作为索引列（适合表达式查询）：

CREATE INDEX products_name_upper_idx ON products (category_id, upper(product_name));

或包含原始列，在查询中计算表达式：

-- 索引包含原始列`product_name`
CREATE INDEX products_cat_brand_name_idx ON products (category_id, brand_id) INCLUDE (product_name);
-- 查询中计算表达式
SELECT upper(product_name) FROM products WHERE category_id = 1 AND brand_id = 101;

报错3：`ERROR: index "idx_name" does not support covering indexes`

原因：使用了不支持覆盖索引的索引类型（如Hash索引）。

解决办法：更换为支持覆盖索引的类型（如B-tree）。

参考链接：

多列索引：www.postgresql.org/docs/17/ind…
覆盖索引与仅索引扫描：www.postgresql.org/docs/17/ind…

往期文章归档

只给表子集建索引？用函数结果建索引？PostgreSQL这俩操作凭啥能省空间又加速？ - cmdragon's Blog
B-tree索引像字典查词一样工作？那哪些数据库查询它能加速，哪些不能？ - cmdragon's Blog
想抓PostgreSQL里的慢SQL？pg_stat_statements基础黑匣子和pg_stat_monitor时间窗，谁能帮你更准揪出性能小偷？ - cmdragon's Blog
PostgreSQL的“时光机”MVCC和锁机制是怎么搞定高并发的？ - cmdragon's Blog
PostgreSQL性能暴涨的关键？内存IO并发参数居然要这么设置？ - cmdragon's Blog
大表查询慢到翻遍整个书架？PostgreSQL分区表教你怎么“分类”才高效
PostgreSQL 查询慢？是不是忘了优化 GROUP BY、ORDER BY 和窗口函数？ - cmdragon's Blog
PostgreSQL里的子查询和CTE居然在性能上“掐架”？到底该站哪边？ - cmdragon's Blog
PostgreSQL选Join策略有啥小九九？Nested Loop/Merge/Hash谁是它的菜？ - cmdragon's Blog
PostgreSQL新手SQL总翻车？这7个性能陷阱你踩过没？ - cmdragon's Blog
PostgreSQL索引选B-Tree还是GiST？“瑞士军刀”和“多面手”的差别你居然还不知道？ - cmdragon's Blog
想知道数据库怎么给查询“算成本选路线”？EXPLAIN能帮你看明白？ - cmdragon's Blog
PostgreSQL处理SQL居然像做蛋糕？解析到执行的4步里藏着多少查询优化的小心机？ - cmdragon's Blog
PostgreSQL备份不是复制文件？物理vs逻辑咋选？误删还能精准恢复到1分钟前？ - cmdragon's Blog
转账不翻车、并发不干扰，PostgreSQL的ACID特性到底有啥魔法？ - cmdragon's Blog
银行转账不白扣钱、电商下单不超卖，PostgreSQL事务的诀窍是啥？ - cmdragon's Blog
PostgreSQL里的PL/pgSQL到底是啥？能让SQL从“说目标”变“讲步骤”？ - cmdragon's Blog
PostgreSQL视图不存数据？那它怎么简化查询还能递归生成序列和控制权限？ - cmdragon's Blog
PostgreSQL索引这么玩，才能让你的查询真的“飞”起来？ - cmdragon's Blog
PostgreSQL的表关系和约束，咋帮你搞定用户订单不混乱、学生选课不重复？ - cmdragon's Blog
PostgreSQL查询的筛子、排序、聚合、分组？你会用它们搞定数据吗？ - cmdragon's Blog
PostgreSQL数据类型怎么选才高效不踩坑？ - cmdragon's Blog
想解锁PostgreSQL查询从基础到进阶的核心知识点？你都get了吗？ - cmdragon's Blog
PostgreSQL DELETE居然有这些操作？返回数据、连表删你试过没？ - cmdragon's Blog
PostgreSQL UPDATE语句怎么玩？从改邮箱到批量更新的避坑技巧你都会吗？ - cmdragon's Blog
PostgreSQL插入数据还在逐条敲？批量、冲突处理、返回自增ID的技巧你会吗？ - cmdragon's Blog
PostgreSQL的“仓库-房间-货架”游戏，你能建出电商数据库和表吗？ - cmdragon's Blog
PostgreSQL 17安装总翻车？Windows/macOS/Linux避坑指南帮你搞定？ - cmdragon's Blog
能当关系型数据库还能玩对象特性，能拆复杂查询还能自动管库存，PostgreSQL凭什么这么香？ - cmdragon's Blog
给接口加新字段又不搞崩老客户端？FastAPI的多版本API靠哪三招实现？ - cmdragon's Blog
流量突增要搞崩FastAPI？熔断测试是怎么防系统雪崩的？ - cmdragon's Blog
FastAPI秒杀库存总变负数？Redis分布式锁能帮你守住底线吗 - cmdragon's Blog
FastAPI的CI流水线怎么自动测端点，还能让Allure报告美到犯规？ - cmdragon's Blog
如何用GitHub Actions为FastAPI项目打造自动化测试流水线？ - cmdragon's Blog
如何用Git Hook和CI流水线为FastAPI项目保驾护航？ - cmdragon's Blog
FastAPI如何用契约测试确保API的「菜单」与「菜品」一致？
为什么TDD能让你的FastAPI开发飞起来？ - cmdragon's Blog
如何用FastAPI玩转多模块测试与异步任务，让代码不再“闹脾气”？ - cmdragon's Blog
如何在FastAPI中玩转“时光倒流”的数据库事务回滚测试？
如何在FastAPI中优雅地模拟多模块集成测试？ - cmdragon's Blog
多环境配置切换机制能否让开发与生产无缝衔接？ - cmdragon's Blog
如何在 FastAPI 中巧妙覆盖依赖注入并拦截第三方服务调用？ - cmdragon's Blog
为什么你的单元测试需要Mock数据库才能飞起来？ - cmdragon's Blog
如何在FastAPI中巧妙隔离依赖项，让单元测试不再头疼？ - cmdragon's Blog
如何在FastAPI中巧妙隔离依赖项，让单元测试不再头疼？ - cmdragon's Blog
测试覆盖率不够高？这些技巧让你的FastAPI测试无懈可击！ - cmdragon's Blog
为什么你的FastAPI测试覆盖率总是低得让人想哭？ - cmdragon's Blog
如何让FastAPI测试不再成为你的噩梦？ - cmdragon's Blog
FastAPI测试环境配置的秘诀，你真的掌握了吗？ - cmdragon's Blog
全链路追踪如何让FastAPI微服务架构的每个请求都无所遁形？ - cmdragon's Blog

免费好用的热门在线工具

Mermaid 在线编辑器 - 应用商店 | By cmdragon
数学求解计算器 - 应用商店 | By cmdragon
智能提词器 - 应用商店 | By cmdragon
魔法简历 - 应用商店 | By cmdragon
Image Puzzle Tool - 图片拼图工具 | By cmdragon
字幕下载工具 - 应用商店 | By cmdragon
歌词生成工具 - 应用商店 | By cmdragon
网盘资源聚合搜索 - 应用商店 | By cmdragon
ASCII字符画生成器 - 应用商店 | By cmdragon
JSON Web Tokens 工具 - 应用商店 | By cmdragon
Bcrypt 密码工具 - 应用商店 | By cmdragon
GIF 合成器 - 应用商店 | By cmdragon
GIF 分解器 - 应用商店 | By cmdragon
文本隐写术 - 应用商店 | By cmdragon
CMDragon 在线工具 - 高级AI工具箱与开发者套件 | 免费好用的在线工具
应用商店 - 发现1000+提升效率与开发的AI工具和实用程序 | 免费好用的在线工具
CMDragon 更新日志 - 最新更新、功能与改进 | 免费好用的在线工具
支持我们 - 成为赞助者 | 免费好用的在线工具
AI文本生成图像 - 应用商店 | 免费好用的在线工具
临时邮箱 - 应用商店 | 免费好用的在线工具
二维码解析器 - 应用商店 | 免费好用的在线工具
文本转思维导图 - 应用商店 | 免费好用的在线工具
正则表达式可视化工具 - 应用商店 | 免费好用的在线工具
文件隐写工具 - 应用商店 | 免费好用的在线工具
IPTV 频道探索器 - 应用商店 | 免费好用的在线工具
快传 - 应用商店 | 免费好用的在线工具
随机抽奖工具 - 应用商店 | 免费好用的在线工具
动漫场景查找器 - 应用商店 | 免费好用的在线工具
时间工具箱 - 应用商店 | 免费好用的在线工具
网速测试 - 应用商店 | 免费好用的在线工具
AI 智能抠图工具 - 应用商店 | 免费好用的在线工具
背景替换工具 - 应用商店 | 免费好用的在线工具
艺术二维码生成器 - 应用商店 | 免费好用的在线工具
Open Graph 元标签生成器 - 应用商店 | 免费好用的在线工具
图像对比工具 - 应用商店 | 免费好用的在线工具
图片压缩专业版 - 应用商店 | 免费好用的在线工具
密码生成器 - 应用商店 | 免费好用的在线工具
SVG优化器 - 应用商店 | 免费好用的在线工具
调色板生成器 - 应用商店 | 免费好用的在线工具
在线节拍器 - 应用商店 | 免费好用的在线工具
IP归属地查询 - 应用商店 | 免费好用的在线工具
CSS网格布局生成器 - 应用商店 | 免费好用的在线工具
邮箱验证工具 - 应用商店 | 免费好用的在线工具
书法练习字帖 - 应用商店 | 免费好用的在线工具
金融计算器套件 - 应用商店 | 免费好用的在线工具
中国亲戚关系计算器 - 应用商店 | 免费好用的在线工具
Protocol Buffer 工具箱 - 应用商店 | 免费好用的在线工具
IP归属地查询 - 应用商店 | 免费好用的在线工具
图片无损放大 - 应用商店 | 免费好用的在线工具
文本比较工具 - 应用商店 | 免费好用的在线工具
IP批量查询工具 - 应用商店 | 免费好用的在线工具
域名查询工具 - 应用商店 | 免费好用的在线工具
DNS工具箱 - 应用商店 | 免费好用的在线工具
网站图标生成器 - 应用商店 | 免费好用的在线工具
XML Sitemap

本站提供的所有下载资源均来自互联网，仅提供学习交流使用，版权归原作者所有。如需商业使用，请联系原作者获得授权。如您发现有涉嫌侵权的内容，请联系我们邮箱:[email protected]

智享骑

立即下载

复杂查询总拖后腿？PostgreSQL多列索引+覆盖索引的神仙技巧你get没？

多列索引：处理复杂查询条件的利器

多列索引的基本概念与创建

不同索引类型的多列支持与效率

多列索引的使用技巧与限制

覆盖索引与仅索引扫描：避免回表的关键

仅索引扫描的工作原理

如何创建覆盖索引

1. 传统方式：将所有列作为索引列

2. 推荐方式：使用`INCLUDE` clause（PostgreSQL 11+）

覆盖索引的最佳实践

课后Quiz：巩固与实践

问题：优化订单查询

答案解析

问题1：索引创建语句（覆盖+多列B-tree）

问题2：`INCLUDE`的优势

常见报错解决方案

报错1：`ERROR: syntax error at or near "INCLUDE"`

报错2：`ERROR: included column "upper(product_name)" must be a simple column reference`

报错3：`ERROR: index "idx_name" does not support covering indexes`

相关文章

最新下载

找房a+软件

掌握江夏(江夏tv直播)

南太湖号app客户端

最新教程

最新专题

热门推荐

复杂查询总拖后腿？PostgreSQL多列索引+覆盖索引的神仙技巧你get没？

多列索引：处理复杂查询条件的利器

多列索引的基本概念与创建

不同索引类型的多列支持与效率

多列索引的使用技巧与限制

覆盖索引与仅索引扫描：避免回表的关键

仅索引扫描的工作原理

如何创建覆盖索引

1. 传统方式：将所有列作为索引列

2. 推荐方式：使用INCLUDE clause（PostgreSQL 11+）

覆盖索引的最佳实践

课后Quiz：巩固与实践

问题：优化订单查询

答案解析

问题1：索引创建语句（覆盖+多列B-tree）

问题2：INCLUDE的优势

常见报错解决方案

报错1：ERROR: syntax error at or near "INCLUDE"

报错2：ERROR: included column "upper(product_name)" must be a simple column reference

报错3：ERROR: index "idx_name" does not support covering indexes

相关文章

最新下载

找房a+软件

掌握江夏(江夏tv直播)

南太湖号app客户端

最新教程

最新专题

热门推荐

2. 推荐方式：使用`INCLUDE` clause（PostgreSQL 11+）

问题2：`INCLUDE`的优势

报错1：`ERROR: syntax error at or near "INCLUDE"`

报错2：`ERROR: included column "upper(product_name)" must be a simple column reference`

报错3：`ERROR: index "idx_name" does not support covering indexes`