为什么 Java字符流不能直接用来安全地读取/拷贝二进制文件（如图片、视频）？

Question

Accepted Answer

Java 字符流（如 、）不能用来读取或拷贝图片、视频等二进制文件的核心原因在于：字符流在读写过程中会进行“字符编码与解码（Character Encoding/Decoding）”，这个过程会导致二进制数据的不可逆损坏。 下面我们深度解析其背后的底层原因、工作原理以及会导致的具体后果。 --- 1. 核心原因：编码/解码造成的“信息失真” 字符流的设计初衷是处理文本。它的工作流程是： 读取时：将磁盘上的字节（Byte）根据某种字符集（如 UTF-8、GBK）解码成 Java 内存中的字符（Char，UTF-16 编码）。 写入时：将内存中的字符根据字符集编码回对应的字节写入磁盘。 然而，二进制文件（图片、视频、PDF、MP3 等）的字节数据是任意的（范围在 到 之间），它们并不是按照任何字符集规范组织的。当用字符流处理它们时，会发生以下致命问题： ① 无法识别的字节被替换（乱码与信息丢失） 在很多字符集（如 UTF-8）中，某些特定的字节组合是“非法”的（不符合字符编码规则）。 发生什么： 当字符流遇到这些无法识别的字节时，它无法将其映射到任何字符，于是会用一个默认的占位字符来...

特性	字节流 (Byte Stream)	字符流 (Character Stream)
代表类	`InputStream`, `OutputStream`	`Reader`, `Writer`
操作单位	字节 (`byte` / 8-bit)	字符 (`char` / 16-bit)
编码转换	无（原样搬运，最安全）	有（按字符集解码/编码）
适用场景	视频、图片、音频、压缩包、任何二进制文件	纯文本文件（TXT, HTML, CSV）

播面

为什么 Java字符流不能直接用来安全地读取/拷贝二进制文件（如图片、视频）？

1. 核心原因：编码/解码造成的“信息失真”

① 无法识别的字节被替换（乱码与信息丢失）

② 映射关系不对等（多对一或多字节合并）

2. 具体案例对比

情况 A：使用字节流（Safe）

情况 B：使用字符流（UTF-8 编码，Unsafe）

3. 其他潜在问题：平台换行符转换

Summary：总结与正确做法

你好！我是 Bomian 助手