Python bytearray() 函数（深入浅出）

Python bytearray() 函数：掌握可变字节序列的核心工具

在 Python 的数据类型家族中，bytearray 是一个常被初学者忽略，但对中高级开发者极具价值的类型。它与 bytes 类型非常相似，但关键区别在于：可变性。当我们需要频繁修改字节内容时，bytearray 就成了理想选择。

想象一下你在处理一个文件的二进制数据，比如一张图片的像素信息。如果使用 bytes，每次修改一个字节都要重新创建整个对象，效率极低。而 bytearray 像一个可编辑的“字节缓冲区”，允许你直接在原地修改数据，节省内存，提升性能。

今天我们就来深入剖析 Python bytearray() 函数，从基础用法到高级技巧，帮助你真正掌握这个实用工具。

创建数组与初始化

bytearray() 函数用于创建一个可变的字节序列对象。它的语法非常简洁：

bytearray([source[, encoding[, errors]]])

参数说明：

source：可选，指定初始数据来源
encoding：可选，当 source 是字符串时，指定编码方式
errors：可选，处理编码错误的方式

无参数初始化

当不传入任何参数时，会创建一个空的 bytearray，长度为 0：

empty_array = bytearray()
print(empty_array)  # 输出: bytearray(b'')
print(len(empty_array))  # 输出: 0

💡 提示：虽然看起来“空”，但它是一个真正的可变对象，后续可以动态添加字节。

从整数列表初始化

最常见的用法之一是传入一个整数列表，每个整数代表一个字节值（0 到 255 之间）：

data = bytearray([72, 101, 108, 108, 111])
print(data)  # 输出: bytearray(b'Hello')
print(type(data))  # 输出: <class 'bytearray'>

for i, byte in enumerate(data):
    print(f"第 {i} 个字节的值: {byte}")

✅ 说明：72 是字符 'H' 的 ASCII 码，101 是 'e'，依此类推。这个例子展示了如何将文本转换为字节形式。

从字符串初始化

当源数据是字符串时，需要指定编码方式。例如 UTF-8 或 ASCII：

text = "你好世界"
byte_array = bytearray(text, encoding='utf-8')
print(byte_array)  # 输出: bytearray(b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c')

for i, byte in enumerate(byte_array):
    print(f"第 {i} 字节: {byte:02x}")  # 以十六进制显示

⚠️ 注意：中文字符在 UTF-8 编码下占用 3 个字节，因此 "你好世界" 一共 12 个字节。

常见用法与操作

一旦创建了 bytearray，就可以像列表一样进行增删改查操作。这是它与不可变 bytes 的最大区别。

修改字节值

你可以通过索引直接修改某个字节的值：

message = bytearray(b"Python is great")
print("原始内容:", message)

message[0] = ord('p')  # ord('p') 返回 112
print("修改后:", message)  # 输出: bytearray(b"python is great")

📌 小贴士：ord() 函数用于获取字符的 ASCII 码，chr() 则相反，用于根据码值生成字符。

添加与删除字节

支持 append() 添加单个字节，extend() 扩展多个字节，insert() 插入特定位置：

arr = bytearray(b"Hello")

arr.append(33)  # 33 是感叹号 '!' 的 ASCII 码
print(arr)  # 输出: bytearray(b'Hello!')

arr.extend([65, 66, 67])  # 添加 'A', 'B', 'C'
print(arr)  # 输出: bytearray(b'Hello!ABC')

arr.insert(5, 44)  # 44 是逗号 ',' 的 ASCII 码
print(arr)  # 输出: bytearray(b'Hello,ABC')

切片操作

bytearray 支持切片，但注意切片结果仍然是 bytearray 类型，而非 bytes：

data = bytearray(b"Programming")
print("原始:", data)

subset = data[:3]
print("前3字节:", subset)  # 输出: bytearray(b'Pro')

subset[0] = 115  # 将 'P' 改为 's'
print("修改后原始数组:", data)  # 输出: bytearray(b'srogramming')

🔍 关键点：切片操作是“视图”机制，修改切片会影响原数组，这是可变性的体现。

与 bytes 的对比与选择

理解 bytearray 和 bytes 的差异，有助于你在项目中做出合理选择。

特性	bytes	bytearray
可变性	不可变	可变
内存效率	高（不可变，适合共享）	中（可变，适合频繁修改）
使用场景	网络传输、文件读写、加密	编码处理、数据流缓冲、内存操作
支持操作	索引、切片、比较	索引、切片、修改、增删

text = "Hello"

b = bytes(text, encoding='utf-8')

ba = bytearray(text, encoding='utf-8')
ba[0] = 115  # 成功修改
print(ba)  # 输出: bytearray(b'sello')

✅ 建议：如果数据需要多次修改，优先使用 bytearray；如果只读或用于传输，bytes 更安全高效。

实际应用场景

1. 二进制数据处理

在通信协议或文件解析中，经常需要手动构造或解析二进制数据包：

header = bytearray(6)  # 创建 6 字节的空数组
header[0] = 0xAA  # 标志位
header[1] = 0xBB
header[2] = 0x01  # 版本号
header[3] = len("data")  # 数据长度
header[4:6] = b"ID"  # 设置 ID 字段

print("二进制头:", header)

2. 字节流缓冲

在处理大文件或网络流时，bytearray 可以作为临时缓冲区：

buffer = bytearray()

chunks = [b"Hello", b" ", b"World!"]

for chunk in chunks:
    buffer.extend(chunk)  # 添加到缓冲区
    print(f"当前缓冲区: {buffer}")

print("完整消息:", buffer.decode('utf-8'))  # 输出: Hello World!

3. 字符编码转换

在文本处理中，有时需要手动操作编码字节：

original = "测试"
bytes_utf8 = bytearray(original, encoding='utf-8')

bytes_utf8[0] = 0x50  # 修改为 'P'
print("修改后:", bytes_utf8)  # 输出: bytearray(b'P\xe6\xb5\x8b\xe8\xaf\x95')

⚠️ 警告：直接修改 UTF-8 字节可能导致乱码。仅在了解编码规则时使用。

常见误区与最佳实践

误区 1：误认为 bytearray 可以存储任意对象

arr = bytearray()

arr.append(ord('a'))  # 97

误区 2：忽略字节范围限制


value = 300 % 256  # 得到 44
arr.append(value)

最佳实践建议

使用 bytearray 时，始终确保数值在 0 到 255 之间
需要转换回 bytes 时，使用 bytes(bytearray_obj)
用于网络或文件操作前，确保编码正确
大量修改场景优先选择 bytearray，避免频繁创建新对象

总结与展望

Python bytearray() 函数 是一个强大而实用的工具，尤其适合需要频繁修改字节数据的场景。它在性能、灵活性和内存管理之间取得了良好平衡。

通过本文，你已经掌握了：

如何创建和初始化 bytearray
如何进行增删改查操作
与 bytes 的核心区别
实际项目中的典型应用
常见误区与最佳实践

当你在开发网络协议解析、文件处理、数据加密或二进制格式转换时，不妨多考虑一下 bytearray。它或许就是你代码中那个“隐藏的加速器”。

记住：编程不是记住所有函数，而是理解它们的适用场景。当你真正理解了 Python bytearray() 函数 的本质，就能在合适的时候用对工具，写出更高效、更优雅的代码。