黑马程序员Redis教程学习笔记（第8部分）：批处理优化与集群模式最佳实践

课程概述

本篇笔记涵盖黑马程序员Redis教程中关于批处理优化和集群模式下的最佳实践内容，主要包括Redis的SDS（动态字符串）数据结构、Pipeline和MSET批处理优化、以及集群模式下批处理的挑战与解决方案。

1. Redis的SDS（动态字符串）数据结构

为什么需要SDS

Redis虽然是用C语言实现的，但并没有直接使用C语言的字符串，而是自定义了SDS（Simple Dynamic String）结构，因为C语言字符串存在以下问题：

获取长度时间复杂度高：需要遍历整个字符串，时间复杂度为O(N)
非二进制安全：以’\0’作为结束标识，如果字符串中包含’\0’会被误认为结束
不可修改：字符串字面量保存在常量池中，无法修改

SDS结构详解

SDS本质上是一个结构体，包含以下几个部分：

struct SDS {
    uint8_t len;      // 已使用字节数
    uint8_t alloc;    // 总申请字节数（不含结束标识）
    uint8_t flags;    // 头信息类型标识
    char buf[];       // 存储实际数据的字符数组
};

SDS的优势

常数时间获取长度：长度信息直接保存在结构体中，O(1)时间复杂度
二进制安全：通过长度字段确定字符串边界，不依赖结束标识
动态扩展：支持动态扩容，避免频繁内存重分配
内存预分配：采用预分配策略，减少内存分配次数

SDS内存预分配策略

小于1MB：扩容后长度的2倍 + 1（预留结束标识空间）
超过1MB：扩容后长度 + 1MB + 1（预留结束标识空间）

多种SDS类型

Redis定义了多种SDS结构以适应不同长度的字符串： - sdshdr5：5位，已废弃 - sdshdr8：8位，最大2^8-1字节 - sdshdr16：16位，最大2^16-1字节 - sdshdr32：32位，最大2^32-1字节 - sdshdr64：64位，最大2^64-1字节

根据字符串长度自动选择合适的SDS类型，既节省内存又保证性能。

2. 批处理优化策略

单个命令执行的问题

Redis执行单个命令需要经历以下过程： 1. 客户端发起请求到Redis（网络传输） 2. Redis执行命令（命令执行时间） 3. Redis返回结果到客户端（网络传输）

其中网络传输时间往往远大于命令执行时间，特别是在网络延迟较高的情况下。

批量处理优化方案

1. MSET命令优化

MSET命令可以一次性设置多个键值对，减少网络往返次数：

// 优化前：逐个执行，N次网络往返
for(int i = 0; i < 100000; i++){
    jedis.set("test:" + i, "value:" + i);
}

// 优化后：批量执行，1次网络往返
String[] keysAndValues = new String[200000]; // 100000个键值对
for(int i = 0; i < 100000; i++){
    int idx = (i % 1000) << 1; // 计算数组索引
    keysAndValues[idx] = "test:" + i;
    keysAndValues[idx + 1] = "value:" + i;
    
    if(idx == 0){ // 每1000个键值对批量插入一次
        jedis.mset(keysAndValues);
    }
}

2. Pipeline优化

Pipeline允许将多个命令一次性发送到Redis服务器，减少网络往返次数：

// 使用Pipeline进行批量操作
Pipeline pipeline = jedis.pipelined();
for(int i = 0; i < 100000; i++){
    pipeline.set("test:" + i, "value:" + i);
    if(i % 1000 == 0){
        pipeline.sync(); // 每1000个命令同步一次
    }
}
pipeline.sync(); // 最后同步剩余命令

MSET vs Pipeline对比

特性	MSET	Pipeline
原子性	具备原子性，命令一次性执行	不具备原子性，命令按顺序执行
适用场景	相同数据类型，批量设置	任意命令组合，灵活度高
性能	非常高，内置原子操作	高，但略低于MSET
限制	仅支持部分数据类型	支持所有Redis命令

3. 集群模式下的批处理挑战

集群批处理问题

在Redis集群模式下，MSET、Pipeline等批处理命令要求多个Key必须落在同一个槽中，否则会导致执行失败。

问题根源

Redis集群基于哈希槽（16384个槽）实现数据分片，当批处理的多个Key计算出的哈希槽不一致时： 1. 这些Key会被分配到不同的节点 2. 批处理需要跨多个节点执行 3. 无法保证原子性 4. 需要多个连接，违背了批处理初衷

解决方案

1. 串行命令（不推荐）

逐个执行命令，性能最差，但实现简单。

2. 串行Slot方案

计算每个Key的槽值
将槽值相同的命令归为一组
逐组执行批处理
减少了网络往返次数，但仍是串行执行

// 串行Slot实现示例
Map<Integer, List<Map.Entry<String, String>>> slotGroups = new HashMap<>();
for(Map.Entry<String, String> entry : data.entrySet()) {
    int slot = JedisClusterCRC16.getSlot(entry.getKey());
    slotGroups.computeIfAbsent(slot, k -> new ArrayList<>()).add(entry);
}

for(List<Map.Entry<String, String>> group : slotGroups.values()) {
    String[] array = new String[group.size() * 2];
    int idx = 0;
    for(Map.Entry<String, String> entry : group) {
        array[idx++] = entry.getKey();
        array[idx++] = entry.getValue();
    }
    cluster.mset(array); // 每组执行一次MSET
}

3. 并行Slot方案

同样按槽值分组
但使用多线程并行执行各组命令
性能优于串行Slot，但需注意线程安全

4. Hash Tag方案

在Key中使用大括号{}包含相同内容，确保相关Key落在同一槽中：

{user1001}:name
{user1001}:age  
{user1001}:email

这种方案性能最佳，但可能导致数据倾斜。

Spring Boot中的自动优化

Spring Boot的RedisTemplate会自动处理集群下的批处理： - 自动计算Key的槽值 - 按槽值分组 - 使用异步方式执行各组命令 - 实现了并行Slot方案

4. 数据结构选择最佳实践

存储对象的最佳方式

对于存储对象，有三种方式：

1. JSON字符串方式

优点：实现简单
缺点：数据耦合，无法单独修改字段，灵活性差

2. 字段打散方式

优点：可灵活访问任意字段
缺点：占用空间大，每个Key都需要存储元信息

3. 哈希结构方式（推荐）

优点：灵活性好，内存占用小（底层使用ziplist压缩）
缺点：代码实现稍复杂

哈希结构优化

对于大型哈希结构（如超过100万对field-value），应注意：

内存占用问题：当哈希元素超过512个时，Redis会使用哈希表而非ZipList，失去内存优势
拆分策略：将大哈希拆分为多个小哈希，避免Big Key问题
配置优化：可以调整hash-max-ziplist-entries参数，但不建议设置过大

// 哈希拆分示例
// 原来：一个大哈希存储100万条数据
// 现在：将数据按ID/100进行分组，每个哈希存储100条数据
int groupId = id / 100;
String field = String.valueOf(id % 100);
String hashKey = "user_hash:" + groupId;
redisTemplate.opsForHash().put(hashKey, field, userObject);

5. 性能优化建议

批处理注意事项

避免一次传输太多命令：可能导致网络拥塞
合理控制批处理大小：通常建议1000-5000个命令为一批
选择合适的批处理方式：根据数据类型和业务需求选择MSET或Pipeline

集群环境优化

使用并行Slot方案：在Spring Boot中自动实现
谨慎使用Hash Tag：避免数据倾斜
监控Big Key：定期检测和清理Big Key

总结

Redis的批处理优化是提升性能的重要手段，关键在于减少网络往返次数。在单机模式下，可以使用MSET或Pipeline实现批处理；在集群模式下，需要考虑哈希槽分布问题，采用串行或并行Slot方案。

SDS作为Redis的基础数据结构，相比C语言字符串具有明显优势，特别是二进制安全和常数时间获取长度的特性。在实际应用中，应根据具体场景选择合适的数据结构和批处理策略，以达到最佳性能。

黑马程序员Redis教程学习笔记（第8部分）：批处理优化与集群模式最佳实践

黑马程序员Redis教程学习笔记（第8部分）：批处理优化与集群模式最佳实践

课程概述

1. Redis的SDS（动态字符串）数据结构

为什么需要SDS

SDS结构详解

SDS的优势

SDS内存预分配策略

多种SDS类型

2. 批处理优化策略

单个命令执行的问题

批量处理优化方案

1. MSET命令优化

2. Pipeline优化

MSET vs Pipeline对比

3. 集群模式下的批处理挑战

集群批处理问题

问题根源

解决方案

1. 串行命令（不推荐）

2. 串行Slot方案

3. 并行Slot方案

4. Hash Tag方案

Spring Boot中的自动优化

4. 数据结构选择最佳实践

存储对象的最佳方式

1. JSON字符串方式

2. 字段打散方式

3. 哈希结构方式（推荐）

哈希结构优化

5. 性能优化建议

批处理注意事项

集群环境优化

总结

sadsunset的空间

分享文章

文章目录