您的位置: 首页> 数据库

从原理到实战深入理解 MySQL分库分表

匿名上传

发布时间:2026-01-21 08:15:02

MySQL 分库分表：从原理到实战

在互联网高并发、大数据量的业务场景下，单库单表的存储模式会面临性能瓶颈 —— 数据量达到千万级后，磁盘 IO、索引查询、事务处理的效率会急剧下降。分库分表是解决这一问题的核心方案，它通过将数据分散存储到多个数据库或数据表中，提升系统的吞吐量和可用性。

本文将从 What-Why-How 三个维度深度解析 MySQL 分库分表，结合实战案例代码，帮助开发者理解并落地这一技术方案。

一、什么是分库分表？

分库分表是水平拆分和垂直拆分的统称，本质是将单一数据库或数据表的数据，按照特定规则分散到多个物理节点上，从而降低单节点的数据压力。

1. 垂直拆分

垂直拆分是按照业务维度进行拆分，核心思想是 "专库专用"。

垂直分库：将一个包含多业务模块的数据库，拆分为多个独立数据库。例如，电商系统可拆分为用户库、订单库、商品库。
垂直分表：将一个字段繁多的表，拆分为多个结构简单的表。例如，用户表 t_user 可拆分为基础信息表 t_user_base 和详情信息表 t_user_ext。

适用场景：表中字段过多，部分字段访问频率低，或不同字段归属不同业务模块。优势：业务隔离，便于维护；降低单表字段数量，提升查询效率。缺点：无法解决单表数据量过大的问题。

2. 水平拆分

水平拆分是按照数据维度进行拆分，核心思想是 "数据分片"。

水平分库：将一个表的数据分散到多个数据库的相同表结构中。例如，订单表 t_order 拆分为 db_order_0 到 db_order_3 四个库，每个库都有 t_order 表。
水平分表：将一个表的数据分散到同一个数据库的多个表中。例如，订单表 t_order 拆分为 t_order_0 到 t_order_7 八个表。

适用场景：单表数据量巨大（千万级以上），查询和写入性能瓶颈明显。优势：突破单表数据量上限，提升并发读写能力。缺点：引入分布式事务、跨分片查询等复杂问题。

二、为什么需要分库分表？

单库单表的性能瓶颈主要体现在以下几个方面，分库分表是解决这些问题的必经之路：

磁盘 IO 瓶颈：单表数据量过大，查询时需要扫描大量数据页，磁盘随机 IO 耗时严重。
索引性能瓶颈：索引文件随数据量增大而膨胀，B+ 树高度增加，查询时的磁盘 IO 次数增多。
锁竞争瓶颈：高并发下，单表的行锁、表锁竞争激烈，导致事务等待时间过长。
运维成本瓶颈：单库数据量过大，备份、恢复、扩容的时间成本极高，甚至影响业务可用性。

核心目标：提升系统的并发承载能力和数据存储能力，保障业务稳定运行。

三、分库分表的核心方案

1. 分片规则

分片规则是分库分表的核心，决定了数据如何分配到不同的分片节点。常用的分片规则有以下几种：

分片规则	原理	适用场景	优点	缺点
范围分片	按数据的范围区间划分，例如按订单创建时间 `create_time` 分为 2024 年、2025 年分片	时间序列数据，如订单、日志	规则简单，便于扩容	数据热点问题，新分片可能集中承载大量写入
哈希分片	对分片键（如 `user_id`）进行哈希计算，取模后映射到分片	用户 ID、订单 ID 等均匀分布的数据	数据分布均匀，避免热点	扩容时需要迁移数据，复杂度高
列表分片	按分片键的枚举值划分，例如按省份 `province` 分为北京、上海、广东分片	数据具有明确枚举属性的场景	规则直观，便于业务隔离	分片数量固定，扩展灵活度低
复合分片	组合多种规则，例如先按时间范围分片，再按用户 ID 哈希分片	复杂业务场景，如海量订单系统	兼顾多种规则的优势	规则复杂，维护成本高

2. 分片键选择

分片键是决定数据分片的字段，选择合适的分片键是分库分表的关键，需遵循以下原则：

优先选择查询频率高的字段，例如订单表的 user_id、order_id。
避免选择更新频繁的字段，防止数据迁移。
保证数据分布均匀，避免出现 "数据倾斜"。

四、实战案例：基于 Sharding-JDBC 实现分库分表

Sharding-JDBC 是一款轻量级的分库分表框架，它基于 JDBC 层实现，无需独立部署中间件，对业务代码侵入性低，是开发者首选的分库分表方案。

1. 环境准备

（1）技术栈

框架：Spring Boot 2.7.x
分库分表中间件：Sharding-JDBC 5.3.2
数据库：MySQL 8.0
依赖管理：Maven

（2）Maven 依赖

在 pom.xml 中引入核心依赖：

<dependencies>
    <!-- Spring Boot Web -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <!-- MyBatis Plus -->
    <dependency>
        <groupId>com.baomidou</groupId>
        <artifactId>mybatis-plus-boot-starter</artifactId>
        <version>3.5.3.1</version>
    </dependency>
    <!-- Sharding-JDBC -->
    <dependency>
        <groupId>org.apache.shardingsphere</groupId>
        <artifactId>shardingsphere-jdbc-core-spring-boot-starter</artifactId>
        <version>5.3.2</version>
    </dependency>
    <!-- MySQL 驱动 -->
    <dependency>
        <groupId>com.mysql</groupId>
        <artifactId>mysql-connector-j</artifactId>
        <scope>runtime</scope>
    </dependency>
    <!-- Lombok -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>
</dependencies>

2. 需求场景

以电商订单系统为例，实现以下目标：

按 user_id 进行水平分库：分为 2 个库 db_order_0、db_order_1。
按 order_id 进行水平分表：每个库中分为 4 个表 t_order_0-t_order_3。
分片规则：user_id % 2 = 库索引，order_id % 4 = 表索引。

3. 数据库准备

创建 2 个分库，每个库创建 4 个分表，表结构完全一致。

-- 创建分库 db_order_0
CREATE DATABASE IF NOT EXISTS db_order_0 DEFAULT CHARACTER SET utf8mb4;
-- 创建分库 db_order_1
CREATE DATABASE IF NOT EXISTS db_order_1 DEFAULT CHARACTER SET utf8mb4;

-- 切换到 db_order_0
USE db_order_0;
-- 创建订单分表 t_order_0
CREATE TABLE t_order_0 (
    order_id BIGINT PRIMARY KEY COMMENT '订单ID',
    user_id BIGINT NOT NULL COMMENT '用户ID',
    order_amount DECIMAL(10,2) NOT NULL COMMENT '订单金额',
    create_time DATETIME NOT NULL COMMENT '创建时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

-- 同理，在 db_order_0 创建 t_order_1、t_order_2、t_order_3
-- 在 db_order_1 中创建 t_order_0、t_order_1、t_order_2、t_order_3

4. 配置 Sharding-JDBC

在 application.yml 中配置数据源、分片规则、主键生成策略等核心参数：

spring:
  # Sharding-JDBC 配置
  shardingsphere:
    # 数据源配置
    datasource:
      # 数据源名称列表
      names: db_order_0,db_order_1
      # 配置 db_order_0 数据源
      db_order_0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/db_order_0?useSSL=false&serverTimezone=UTC&allowPublicKeyRetrieval=true
        username: root
        password: root
      # 配置 db_order_1 数据源
      db_order_1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/db_order_1?useSSL=false&serverTimezone=UTC&allowPublicKeyRetrieval=true
        username: root
        password: root
    # 规则配置
    rules:
      sharding:
        # 分片算法配置
        sharding-algorithms:
          # 分库算法：基于 user_id 取模
          db-mod-algorithm:
            type: INLINE
            props:
              algorithm-expression: db_order_${user_id % 2}
          # 分表算法：基于 order_id 取模
          table-mod-algorithm:
            type: INLINE
            props:
              algorithm-expression: t_order_${order_id % 4}
        # 表规则配置
        tables:
          # 逻辑表名称
          t_order:
            # 数据节点：分库.分表
            actual-data-nodes: db_order_${0..1}.t_order_${0..3}
            # 分库策略
            database-strategy:
              standard:
                sharding-column: user_id
                sharding-algorithm-name: db-mod-algorithm
            # 分表策略
            table-strategy:
              standard:
                sharding-column: order_id
                sharding-algorithm-name: table-mod-algorithm
            # 主键生成策略
            key-generate-strategy:
              column: order_id
              key-generator-name: snowflake
        # 主键生成器
        key-generators:
          snowflake:
            type: SNOWFLAKE
    # 属性配置
    props:
      # 打印 SQL 语句，便于调试
      sql-show: true
# MyBatis Plus 配置
mybatis-plus:
  mapper-locations: classpath:mapper/*.xml
  type-aliases-package: com.example.sharding.entity
  configuration:
    map-underscore-to-camel-case: true
    log-impl: org.apache.ibatis.logging.stdout.StdOutImpl

5. 业务代码实现

（1）实体类 `Order.java`

package com.example.sharding.entity;

import com.baomidou.mybatisplus.annotation.TableName;
import lombok.Data;
import java.math.BigDecimal;
import java.util.Date;

@Data
@TableName("t_order") // 对应逻辑表名称
public class Order {
    /**
     * 订单ID，雪花算法生成
     */
    private Long orderId;
    /**
     * 用户ID，分库键
     */
    private Long userId;
    /**
     * 订单金额
     */
    private BigDecimal orderAmount;
    /**
     * 创建时间
     */
    private Date createTime;
}

（2）Mapper 接口 `OrderMapper.java`

package com.example.sharding.mapper;

import com.baomidou.mybatisplus.core.mapper.BaseMapper;
import com.example.sharding.entity.Order;
import org.apache.ibatis.annotations.Mapper;

@Mapper
public interface OrderMapper extends BaseMapper<Order> {
}

（3）Service 层 `OrderService.java`

package com.example.sharding.service;

import com.baomidou.mybatisplus.extension.service.impl.ServiceImpl;
import com.example.sharding.entity.Order;
import com.example.sharding.mapper.OrderMapper;
import org.springframework.stereotype.Service;
import java.util.Date;

@Service
public class OrderService extends ServiceImpl<OrderMapper, Order> {

    /**
     * 创建订单
     */
    public boolean createOrder(Long userId, Double amount) {
        Order order = new Order();
        order.setUserId(userId);
        order.setOrderAmount(BigDecimal.valueOf(amount));
        order.setCreateTime(new Date());
        return save(order);
    }
}

（4）Controller 层 `OrderController.java`

package com.example.sharding.controller;

import com.example.sharding.service.OrderService;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class OrderController {

    @Autowired
    private OrderService orderService;

    /**
     * 测试创建订单接口
     */
    @GetMapping("/order/create")
    public String createOrder(@RequestParam Long userId, @RequestParam Double amount) {
        boolean result = orderService.createOrder(userId, amount);
        return result ? "订单创建成功" : "订单创建失败";
    }
}

6. 测试验证

启动 Spring Boot 项目，调用接口进行测试：

# 测试 user_id=1（模2=1，对应 db_order_1）
curl "http://localhost:8080/order/create?userId=1&amount=100.0"
# 测试 user_id=2（模2=0，对应 db_order_0）
curl "http://localhost:8080/order/create?userId=2&amount=200.0"

查看控制台打印的 SQL 语句，可以看到 Sharding-JDBC 自动路由到了对应的分库分表：

-- user_id=1 时，路由到 db_order_1.t_order_x
INSERT INTO t_order_1 (order_id, user_id, order_amount, create_time) VALUES (?, ?, ?, ?)
-- user_id=2 时，路由到 db_order_0.t_order_y
INSERT INTO t_order_2 (order_id, user_id, order_amount, create_time) VALUES (?, ?, ?, ?)

四、分库分表的核心问题与解决方案

分库分表虽然解决了性能瓶颈，但也引入了分布式场景下的复杂问题，以下是常见问题及应对方案：

1. 分布式事务问题

问题：跨库操作时，无法保证事务的 ACID 特性，例如用户下单时需要同时操作订单库和库存库。解决方案：

柔性事务：采用最终一致性方案，如 Seata 的 TCC、SAGA 模式。
本地消息表：基于消息队列实现事务补偿，保证数据最终一致。

2. 跨分片查询问题

问题：按非分片键查询时，需要扫描所有分片，性能低下。解决方案：

二次查询：先按分片键查询得到数据分布，再精准查询对应分片。
引入中间件：使用 Elasticsearch 构建全局索引，通过 ES 先检索数据所在分片，再查询 MySQL。
业务优化：尽量避免非分片键的查询，设计业务时优先使用分片键作为查询条件。

3. 数据迁移与扩容问题

问题：哈希分片扩容时，数据分布规则改变，需要迁移大量数据。解决方案：

预分片：提前规划足够的分片数量，例如按 1024 个分片预分配，初期只使用部分分片。
一致性哈希：使用一致性哈希算法，减少扩容时的数据迁移量。
使用专业工具：如 ShardingSphere 的数据迁移工具、阿里云 DTS 等。

4. 读写分离结合

问题：分库分表后，读压力依然较大。解决方案：

结合主从复制，实现读写分离：主库负责写入，从库负责查询。
Sharding-JDBC 支持读写分离配置，可直接在 application.yml 中配置主从数据源。

五、分库分表的最佳实践

优先垂直拆分，再水平拆分：垂直拆分成本低、风险小，先通过垂直拆分隔离业务，当单表数据量达到千万级再进行水平拆分。
分片键的选择至关重要：优先选择查询频率高、数据分布均匀的字段，避免使用时间等易产生热点的字段。
避免过度拆分：拆分粒度越细，运维复杂度越高，需根据业务规模合理规划分片数量。
监控与运维：部署分片监控工具，实时监控各分片的负载情况；定期备份数据，制定容灾方案。

六、总结

分库分表是解决 MySQL 性能瓶颈的核心方案，但它不是 "银弹"—— 它带来了复杂度的提升，需要开发者在性能和复杂度之间做权衡。

在实际项目中，应遵循 "业务驱动技术" 的原则：先通过索引优化、SQL 优化、缓存优化等手段提升性能，当这些手段无法满足需求时，再考虑分库分表。

本文提供的 Sharding-JDBC 案例代码，可直接用于项目开发，开发者可根据实际业务场景调整分片规则和配置。

本站提供的所有下载资源均来自互联网，仅提供学习交流使用，版权归原作者所有。如需商业使用，请联系原作者获得授权。如您发现有涉嫌侵权的内容，请联系我们邮箱:alixiixcom@163.com

节奏大师修改版2016年最新版

音乐舞蹈游戏节奏大师闯关

立即下载

从原理到实战深入理解 MySQL分库分表

MySQL 分库分表：从原理到实战

一、什么是分库分表？

1. 垂直拆分

2. 水平拆分

二、为什么需要分库分表？

三、分库分表的核心方案

1. 分片规则

2. 分片键选择

四、实战案例：基于 Sharding-JDBC 实现分库分表

1. 环境准备

（1）技术栈

（2）Maven 依赖

2. 需求场景

3. 数据库准备

4. 配置 Sharding-JDBC

5. 业务代码实现

（1）实体类 `Order.java`

（2）Mapper 接口 `OrderMapper.java`

（3）Service 层 `OrderService.java`

（4）Controller 层 `OrderController.java`

6. 测试验证

四、分库分表的核心问题与解决方案

1. 分布式事务问题

2. 跨分片查询问题

3. 数据迁移与扩容问题

4. 读写分离结合

五、分库分表的最佳实践

六、总结

相关文章

最新下载

梅特尔恐怖逃生

软糖射手所有枪械

我要翘课

最新教程

最新专题

热门推荐

从原理到实战深入理解 MySQL分库分表

MySQL 分库分表：从原理到实战

一、什么是分库分表？

1. 垂直拆分

2. 水平拆分

二、为什么需要分库分表？

三、分库分表的核心方案

1. 分片规则

2. 分片键选择

四、实战案例：基于 Sharding-JDBC 实现分库分表

1. 环境准备

（1）技术栈

（2）Maven 依赖

2. 需求场景

3. 数据库准备

4. 配置 Sharding-JDBC

5. 业务代码实现

（1）实体类 Order.java

（2）Mapper 接口 OrderMapper.java

（3）Service 层 OrderService.java

（4）Controller 层 OrderController.java

6. 测试验证

四、分库分表的核心问题与解决方案

1. 分布式事务问题

2. 跨分片查询问题

3. 数据迁移与扩容问题

4. 读写分离结合

五、分库分表的最佳实践

六、总结

相关文章

最新下载

梅特尔恐怖逃生

软糖射手所有枪械

我要翘课

最新教程

最新专题

热门推荐

（1）实体类 `Order.java`

（2）Mapper 接口 `OrderMapper.java`

（3）Service 层 `OrderService.java`

（4）Controller 层 `OrderController.java`