消费者拉取到一批消息，异步交给线程池处理后立马同步提交了Offset。如果此时机器宕机，这批尚未处理完的消息会怎样？

Question

Accepted Answer

结论非常明确：这批尚未处理完的消息会发生“业务层面的永久丢失”。 下面为您详细剖析原因、造成的后果以及正确的解决/避免方案： 1. 为什么会丢失？（原理解析） Kafka 对消息是否被消费的判断标准唯一且简单：看 Offset 是否已经被提交。 在你的场景中，时间线如下： 1. 拉取消息：消费者 拉取了 Offsets 为 100150 的一批消息。 2. 异步投递：消费者将这 50 条消息放入了 Java 线程池（存在于 JVM 内存的阻塞队列或正在被工作线程执行）。 3. 同步提交：消费者主线程立刻执行 ，告诉 Kafka：“我已经处理完 100150 的消息了，下次请从 151 开始发给我。”，Kafka 随即将 151 记录到 主题中。 4. 机器宕机：由于是异步处理，线程池可能才处理到 105，剩下的 106150 还在内存中。宕机导致内存清空，这些消息随之灰飞烟灭。 5. 服务重启/Rebalance：机器重启后，或者 Kafka 触发 Rebalance 把该分区分配给其他消费者机器。新的消费者去 Kafka 查询消费进度，Kafka 告诉它：“从 151 开始消费...

播面

消费者拉取到一批消息，异步交给线程池处理后立马同步提交了Offset。如果此时机器宕机，这批尚未处理完的消息会怎样？

1. 为什么会丢失？（原理解析）

2. 补救措施（宕机已经发生怎么办？）

3. 如何避免？（正确的架构设计）

方案一：主线程阻塞等待异步结果（最推荐、不易出错）

方案二：维护本地 Offset 缓存（高性能，但实现极难）

方案三：将 Offset 提交与业务处理放在同一本地事务中（Exactly-Once）

总结

你好！我是 Bomian 助手