Redis 线程模型精解

知识点图片

本文讲解Redis线程模型：核心为单线程处理命令，通过I/O多路复用实现高并发，并引入后台多线程辅助处理网络I/O和耗时任务，以提升性能。

我们来深入且系统地讲解一下 Redis 的线程模型。

这是一个非常经典且重要的话题。简单来说，Redis 的线程模型可以概括为：单线程的命令处理 + 高效的 I/O 多路复用 + 后台多线程辅助。

下面我们分点详细解析。

1. 核心：单线程的命令处理引擎

这是 Redis 线程模型最广为人知的一点。Redis 使用一个主线程来处理所有的客户端请求，包括接收连接、读取请求、解析命令、执行命令、写入响应等。

为什么 Redis 敢于使用单线程？

这似乎与现代多核 CPU 的趋势背道而驰，但 Redis 这样做是基于以下几个关键原因：

CPU 并非性能瓶颈：Redis 的绝大多数操作都是基于内存的，其速度极快（通常在微秒级别）。对于 Redis 来说，性能瓶颈通常是网络 I/O 或 内存大小，而不是 CPU。单次操作的 CPU 耗时非常短，因此用单线程处理已经足够快。
避免了多线程的复杂性：
- 无锁竞争：使用单线程模型，就不需要在数据结构上进行加锁、解锁等操作，避免了锁竞争带来的性能开销和死锁等问题。这使得 Redis 的代码实现更简单，也更容易维护。
- 无上下文切换开销：多线程在进行任务切换时，需要保存和恢复线程的上下文，这会带来一定的性能损耗。单线程则完全没有这部分开销。
保证了操作的原子性：因为所有命令都在一个线程中串行执行，所以每个命令的执行都是原子性的，不会被其他命令中断。这使得像 INCR、LPUSH 这样的操作可以天然地保证原子性，而无需复杂的事务机制。

2. 基石：I/O 多路复用 (I/O Multiplexing)

既然是单线程，那 Redis 是如何处理成千上万的并发连接的呢？如果使用普通的阻塞 I/O，一个线程在等待某个客户端的读/写操作时，就会被阻塞，无法处理其他客户端的请求。

答案就是 I/O 多路复用。

这是 Redis 高性能的关键所在。

I/O 多路复用是一种机制，它允许单个线程监视多个文件描述符（Socket）。一旦某个文件描述符就绪（即可以进行读或写操作），它就会通知应用程序，应用程序再去进行相应的操作。

工作原理类比：
- 阻塞I/O：就像你去餐厅点餐，你点完菜后，服务员就站在你桌边一直等你吃完，才能去服务下一桌。效率极低。
- I/O多路复用：就像一个高效的服务员，他同时管理很多桌客人。他会问A桌：“你们准备好点菜了吗？” A桌没准备好，他不会傻等，而是立刻去问B桌、C桌。他脑子里有个“就绪列表”，只要哪桌举手（事件就绪），他就立刻过去服务。

Redis 利用操作系统提供的 epoll (Linux)、kqueue (BSD/macOS)、select (通用但性能较差) 等机制，实现了一个事件循环 (Event Loop)。

Redis 的事件循环流程如下：

主线程将所有客户端的 Socket 连接都注册到 I/O 多路复用模型中（例如 epoll）。
主线程调用 epoll_wait 等待事件发生，此时主线程处于阻塞状态，但它不消耗 CPU。
当一个或多个客户端有数据到达时（读事件就绪），或者可以向客户端写入数据时（写事件就绪），epoll_wait 会被唤醒并返回所有就绪的事件。
主线程会遍历所有就绪的事件，并依次进行处理（读取数据 -> 解析命令 -> 执行命令 -> 写入响应）。
处理完所有就绪事件后，主线程再次回到第 2 步，继续等待新的事件。

通过这种方式，Redis 的单线程可以高效地处理大量并发连接，因为它只在真正有事可做的时候才工作，大部分时间都花在实际的数据读、写和计算上，而不是在空等待上。

3. 演进：后台多线程辅助

虽然 Redis 的核心命令处理是单线程的，但认为“Redis 完全是单线程”是一种过时的观念。从 Redis 4.0 开始，为了解决一些单线程模型的痛点，Redis 引入了后台多线程来处理一些耗时的任务。

这些后台线程不会执行客户端命令，它们只是辅助主线程工作。

Redis 4.0: 懒惰删除 (Lazy Freeing)
- 痛点：当删除一个非常大的键时（例如包含数百万个元素的 Hash 或 Set），释放内存的操作可能会阻塞主线程长达数秒，导致服务不可用。
- 解决方案：引入 UNLINK 命令（对应 DEL）、FLUSHALL ASYNC、FLUSHDB ASYNC。当执行这些命令时，主线程只会在键空间中将该键元数据删除（这是一个极快的操作），然后将真正的内存回收任务丢给一个后台线程队列去慢慢执行。
Redis 6.0: 多线程 I/O (I/O Threading)
- 痛点：随着网络带宽的提升（例如 10Gbps、40Gbps），单线程在进行网络数据读写（从 Socket 读数据、将数据写回 Socket）时，也会达到性能瓶颈，因为这部分操作也需要消耗 CPU。
- 解决方案：引入了多线程 I/O。
  - 主线程：仍然负责接收连接和执行命令。
  - I/O 线程：可以有多个，它们分担网络数据的读取和写入工作。
  - 工作流程：
    1. 主线程接收到新连接，并将其分配给一个 I/O 线程。
    2. I/O 线程负责从 Socket 中读取客户端的请求数据，解析出第一个命令后，将其放入一个队列。
    3. 主线程从队列中取出已解析的命令，并单线程地执行它。
    4. 执行完毕后，主线程将响应数据写入缓冲区，再将这个连接交给 I/O 线程。
    5. I/O 线程负责将缓冲区的数据异步地写回到客户端 Socket。
- 关键点：命令的执行部分依然是单线程的，这保留了 Redis 无锁和原子性的优点。多线程仅仅分担了网络 I/O 的压力，极大地提升了在高并发、大数据量场景下的吞吐量。这个功能默认是关闭的，可以通过 redis.conf 中的 io-threads 和 io-threads-do-reads 配置项来开启。

总结

Redis 版本	线程模型	描述
< 4.0	纯单线程	所有的网络 I/O 和命令执行都在一个主线程中完成。
4.0 ~ 6.0	单线程 + 后台线程	核心命令处理依然是单线程，但引入了后台线程来异步处理耗时的操作，如大键删除（Lazy Freeing）。
>= 6.0	主线程 + I/O 线程 + 后台线程	在 4.0 的基础上，引入了 I/O 线程来分担网络读写的压力，但命令执行依然由主线程串行完成，以保证原子性和无锁特性。

Redis 的线程模型是一个非常经典的设计，它完美地平衡了性能和简单性：

用单线程执行命令，避免了锁的开销和上下文切换，保证了原子性，简化了实现。
用 I/O 多路复用，解决了单线程处理海量并发连接的效率问题。
用后台多线程，将耗时的非核心任务（如内存释放、网络 I/O）剥离出去，避免阻塞主线程，进一步提升了整体性能和可用性。

播面

1. 核心：单线程的命令处理引擎

2. 基石：I/O 多路复用 (I/O Multiplexing)

3. 演进：后台多线程辅助

总结

你好！我是 Bomian 助手