Node.js Buffer(缓冲区)（一文讲透）

Node.js Buffer(缓冲区)：深入理解二进制数据处理

在 Node.js 的世界里，处理文件读写、网络通信、音频视频流等场景时，我们常常需要操作原始的二进制数据。这些数据不能直接用字符串或普通数组来高效处理。这时候，Node.js 提供了一个核心工具——Buffer(缓冲区)，它就像是一个“内存中的小仓库”，专门用来存储和操作二进制数据。

Buffer 是 Node.js 内置的全局对象，无需引入模块即可使用。它在底层直接操作内存，性能远高于普通 JavaScript 数据类型。对于初学者来说，Buffer 可能显得有些抽象，但一旦掌握，你将能更深入地理解 Node.js 的底层机制。

什么是 Buffer？它的作用是什么？

想象一下，你正在从网络下载一个视频文件。这个视频并不是“文字”或“JSON”，而是由成千上万个字节构成的原始数据流。这些数据以二进制形式存在，需要被逐段读取、处理、拼接。如果我们用字符串来处理，不仅效率低下，还可能破坏数据结构。

这时候，Buffer 就是那个“搬运工”和“临时存储箱”。它在内存中开辟一块连续的空间，用来存放原始的字节数据。它不关心这些字节代表的是图像、音频还是加密数据，只负责“存得下、读得快、改得准”。

在 Node.js 中，Buffer 的作用主要体现在以下几个方面：

文件读写（如 fs.readFile 返回的就是 Buffer）
网络数据传输（如 TCP 通信中的数据包）
图像、音频、视频等多媒体数据处理
加密与解密操作（如使用 crypto 模块时需要 Buffer 输入）

创建 Buffer 的几种方式

使用构造函数创建

最直接的方式是通过 Buffer 构造函数创建一个指定长度的缓冲区。

// 创建一个长度为 10 的 Buffer，初始值为 0
const buf = Buffer.alloc(10);
console.log(buf); // <Buffer 00 00 00 00 00 00 00 00 00 00>

注释：Buffer.alloc(10) 创建一个长度为 10 的缓冲区，所有字节初始化为 0。这是推荐方式，因为它安全且不会包含旧内存数据。

使用指定内容创建

你也可以在创建时传入字符串或数组。

// 从字符串创建，使用 UTF-8 编码
const buf1 = Buffer.from('Hello');
console.log(buf1); // <Buffer 48 65 6c 6c 6f>

// 从十六进制字符串创建
const buf2 = Buffer.from('ffaa', 'hex');
console.log(buf2); // <Buffer ff aa>

// 从数组创建
const buf3 = Buffer.from([1, 2, 3, 255]);
console.log(buf3); // <Buffer 01 02 03 ff>

注释：Buffer.from() 是创建 Buffer 的标准方式。传入字符串时需指定编码（如 'utf8'、'ascii'、'hex'）。hex 编码表示输入是十六进制字符串，如 'ff' 表示字节 255。

从现有 Buffer 拷贝

你可以通过 Buffer.from() 从另一个 Buffer 创建副本。

const original = Buffer.from([1, 2, 3]);
const copy = Buffer.from(original);
console.log(copy); // <Buffer 01 02 03>

注释：这种方式创建的是深拷贝，新 Buffer 与原 Buffer 互不影响，适合数据隔离场景。

Buffer 的基本操作：读写与转换

Buffer 支持对单个字节进行读写操作，就像数组一样，但更高效。

const buf = Buffer.alloc(5);

// 写入字节
buf[0] = 65; // ASCII 'A'
buf[1] = 66; // ASCII 'B'
buf[2] = 67; // ASCII 'C'

// 读取字节
console.log(buf[0]); // 输出 65

// 读取为字符串（使用 UTF-8 编码）
console.log(buf.toString('utf8', 0, 3)); // 输出 "ABC"

注释：buf.toString('utf8', start, end) 将指定范围的字节转换为字符串。start 是起始索引（包含），end 是结束索引（不包含）。utf8 是最常用的编码方式。

字符串与 Buffer 的相互转换

这是最常见操作之一。

// 字符串转 Buffer
const str = '你好';
const buf = Buffer.from(str, 'utf8');
console.log(buf); // <Buffer e4 b8 80 e5 a5 bd>

// Buffer 转字符串
const str2 = buf.toString('utf8');
console.log(str2); // 输出 "你好"

注释：中文在 UTF-8 编码下每个汉字占用 3 个字节。e4 b8 80 是“你”的编码，e5 a5 bd 是“好”的编码。

Buffer 的高级操作：切片、合并与填充

切片操作（slice）

Buffer 支持 slice() 方法，用于获取指定范围的子缓冲区。

const buf = Buffer.from('Hello World');

// 获取从第 6 个字节开始到末尾的子缓冲区
const subBuf = buf.slice(6);
console.log(subBuf.toString()); // 输出 "World"

// 获取从第 1 到第 4 个字节（不包含第 5 个）
const subBuf2 = buf.slice(1, 5);
console.log(subBuf2.toString()); // 输出 "ello"

注释：slice() 不创建新内存，而是返回原 Buffer 的视图。修改子缓冲区会影响原 Buffer，注意使用场景。

合并 Buffer

多个 Buffer 可以合并成一个。

const buf1 = Buffer.from('Hello ');
const buf2 = Buffer.from('World');
const buf3 = Buffer.from('!');

// 使用 Buffer.concat() 合并
const merged = Buffer.concat([buf1, buf2, buf3]);
console.log(merged.toString()); // 输出 "Hello World!"

注释：Buffer.concat(array, totalLength) 是合并多个 Buffer 的标准方法。totalLength 是可选参数，用于预分配内存，提升性能。

填充 Buffer

可以使用 fill() 方法填充指定值。

const buf = Buffer.alloc(10);
buf.fill(255); // 填充为 255（即 0xff）
console.log(buf); // <Buffer ff ff ff ff ff ff ff ff ff ff>

注释：fill() 可以传入数字、字符串或 Buffer。支持指定起始和结束位置，如 buf.fill(0, 2, 6) 表示从索引 2 到 5 填充为 0。

实际案例：模拟文件读取与拼接

我们来模拟一个从多个小文件中读取数据并合并的场景。

// 模拟三个小文件内容
const file1 = Buffer.from('这是第一部分');
const file2 = Buffer.from('这是第二部分');
const file3 = Buffer.from('这是第三部分');

// 合并所有部分
const whole = Buffer.concat([file1, file2, file3]);

// 输出完整内容
console.log(whole.toString('utf8'));
// 输出：这是第一部分这是第二部分这是第三部分

注释：这个例子模拟了文件分块读取的场景。在真实项目中，fs.readFile 返回的就是 Buffer，多个小文件读取后可通过 Buffer.concat() 合并为完整文件。

常见误区与注意事项

1. 不要直接修改 Buffer 长度

Buffer 的长度是固定的，不能通过 buf.length = 100 来改变。

const buf = Buffer.from('abc');
// buf.length = 100; // ❌ 错误！length 是只读属性

正确做法是创建新 Buffer 或使用 slice()。

2. 使用 `Buffer.alloc()` 而非 `new Buffer()`

new Buffer() 在 Node.js 6+ 已被废弃，且有安全风险（可能包含旧内存数据）。

// ❌ 不推荐
// const buf = new Buffer(10);

// ✅ 推荐
const buf = Buffer.alloc(10);

3. 注意编码选择

不同编码方式会改变字节表示。例如：

const str = 'A';
console.log(Buffer.from(str, 'utf8'));   // <Buffer 41>
console.log(Buffer.from(str, 'ascii'));  // <Buffer 41>
console.log(Buffer.from(str, 'base64')); // <Buffer 41>（base64 编码的 'A' 是 'QQ=='）

建议：除非特殊需求，统一使用 utf8 编码。

总结与进阶建议

Node.js Buffer(缓冲区) 是处理二进制数据的核心工具，它在文件系统、网络通信、加密等场景中无处不在。掌握它，意味着你真正进入了 Node.js 的“底层世界”。

本文从基础创建、读写操作，到高级合并与切片，再到实际案例，层层递进，帮助你建立对 Buffer 的完整认知。记住：

使用 Buffer.alloc() 安全创建
用 toString() 和 from() 实现字符串与 Buffer 的转换
用 concat() 合并多个 Buffer
注意编码选择和内存安全

如果你正在开发文件处理、网络服务或多媒体应用，深入理解 Buffer 将极大提升你的代码质量与性能。

未来你可以进一步学习 stream 模块，它正是基于 Buffer 构建的，用于高效处理大数据流。而 Buffer，正是这一切的基石。