业务方需要发送超过10MB的大报文（如高清图片/大JSON）到Kafka，直接发送会被拒绝，架构上应该如何设计改造或调整参数？

Question

Accepted Answer

在Kafka中处理超过10MB的大报文（尤其是像高清图片、超大JSON这样的大文件），直接调整参数虽然可行，但通常被视为反模式（Anti-pattern），因为Kafka的设计初衷是处理高吞吐的小消息（通常在1KB - 1MB之间）。直接发送大消息会导致严重的内存压力、GC停顿、网络带宽霸占以及整体吞吐量急剧下降。 针对这个问题，业界有三种标准的架构改造方案和一种参数调整方案。以下是详细的架构设计与参数调整指南： --- 方案一：Claim Check Pattern（声明检查模式 / 引用模式）—— 【强烈推荐 🌟】 这是处理大报文最标准、最优雅的架构设计方案。核心思想是“将数据与通知分离”。 架构设计： 1. 外部存储：引入对象存储（如阿里云OSS、AWS S3、MinIO）或分布式文件系统（HDFS、NAS）。 2. Producer侧： - 业务方在发送消息前，先将10MB+的图片或JSON上传到对象存储。 - 获取该文件的下载URL（或对象Key）。 - 将URL和相关元数据（如业务ID、文件大小、校验和）组装成一个很小的JSON（通常不到1KB），发送到Kafka。...