Python 合并字典（一文讲透）

Python 合并字典：从基础到进阶的实用指南

在日常开发中，我们经常需要将多个字典合并成一个。比如，你有两个配置信息，一个来自环境变量，一个来自本地文件，想要统一管理；又或者你在处理用户数据，需要把基本信息和扩展属性合并在一起。这些场景下，Python 合并字典就变得非常关键。

对于初学者来说，可能第一反应是用循环一个个添加键值对。虽然可行，但效率低、代码冗长。Python 提供了多种优雅且高效的方式完成这一操作。本文将带你一步步掌握各种方法，从最基础的 update() 到 Python 3.9 引入的 | 操作符，甚至包括如何处理键冲突。

基础方法：使用 update() 方法

update() 是 Python 字典最经典的方法之一，用于将另一个字典的键值对“更新”到当前字典中。它的特点是原地修改，即修改的是原始字典本身。

dict1 = {'name': 'Alice', 'age': 25}
dict2 = {'city': 'Beijing', 'job': 'Engineer'}

dict1.update(dict2)

print(dict1)

中文注释说明：

dict1.update(dict2) 将 dict2 中的所有键值对添加到 dict1 中。
如果 dict1 已存在相同的键（如 name），那么 dict2 的值会覆盖原来的值。
这种方式适用于你希望直接修改原字典的情况，但不适用于需要保留原始字典不变的场景。

✅ 适用场景：你需要修改原始字典，或者不想创建新对象。

优雅合并：使用字典解包（**kwargs）

Python 支持字典解包语法，即使用 ** 操作符将字典展开为关键字参数。我们可以利用这一点，将多个字典合并成一个新字典。

dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}

merged_dict = {**dict1, **dict2}

print(merged_dict)

中文注释说明：

{**dict1, **dict2} 是一个字典字面量，其中 **dict1 表示把 dict1 的所有键值对展开。
这种方式会创建一个新的字典对象，原字典不受影响。
如果有重复键，后面的字典会覆盖前面的值（如 dict2 中的键覆盖 dict1）。

✅ 优势：简洁、可读性强，适合快速合并。 ❌ 注意：不适用于 Python 3.5 以下版本。

现代方式：使用 | 操作符（Python 3.9+）

从 Python 3.9 开始，引入了新的字典合并运算符 |，语法更直观，像数学运算一样自然。

dict1 = {'x': 10, 'y': 20}
dict2 = {'z': 30, 'w': 40}

result = dict1 | dict2

print(result)

中文注释说明：

dict1 | dict2 会返回一个新字典，不修改原字典。
与 update() 不同，| 是纯函数式操作，不会改变输入。
如果存在重复键，右侧字典的值会覆盖左侧。

dict_a = {'name': 'Bob', 'score': 95}
dict_b = {'name': 'Alice', 'grade': 'A'}

result = dict_a | dict_b
print(result)

✅ 推荐在 Python 3.9+ 环境下使用，语法清晰，逻辑明确。

复杂合并：处理键冲突与合并策略

在真实项目中，合并字典时可能遇到键名冲突。比如两个字典都有 email 字段，你希望保留更优的值，而不是简单覆盖。

这时可以自定义合并逻辑。以下是几种常见策略：

策略一：优先保留第一个字典的值

def merge_with_priority(dict1, dict2):
    # 优先保留 dict1 的值，dict2 只添加新键
    result = dict1.copy()  # 先复制一份，避免修改原字典
    for key, value in dict2.items():
        if key not in result:
            result[key] = value
    return result

dict1 = {'name': 'Tom', 'email': 'tom@x.com'}
dict2 = {'name': 'Jerry', 'phone': '13888888888'}

merged = merge_with_priority(dict1, dict2)
print(merged)

策略二：合并列表类型的值

如果字典中某些值是列表，你希望合并而不是替换，可以这样做：

def merge_lists(dict1, dict2):
    result = dict1.copy()
    for key, value in dict2.items():
        if key in result and isinstance(result[key], list) and isinstance(value, list):
            result[key].extend(value)  # 合并列表
        else:
            result[key] = value
    return result

dict1 = {'hobbies': ['reading', 'swimming']}
dict2 = {'hobbies': ['coding', 'gaming'], 'age': 28}

merged = merge_lists(dict1, dict2)
print(merged)

✅ 实用技巧：在处理配置、日志、用户资料等数据时，这类自定义合并非常常见。

性能对比：不同方法的效率差异

我们来做一个简单的性能测试，比较四种合并方式的执行速度。

import time

dict1 = {f'key_{i}': i for i in range(1000)}
dict2 = {f'key_{i}': i + 1000 for i in range(1000)}

start = time.time()
result1 = dict1.copy()
result1.update(dict2)
time1 = time.time() - start

start = time.time()
result2 = {**dict1, **dict2}
time2 = time.time() - start

start = time.time()
result3 = dict1 | dict2
time3 = time.time() - start

print(f"update(): {time1:.6f} 秒")
print(f"解包：{time2:.6f} 秒")
print(f"| 操作符：{time3:.6f} 秒")

输出示例（实际结果可能略有差异）：

update(): 0.000123 秒
解包：0.000115 秒
| 操作符：0.000108 秒

合并方式	是否创建新对象	是否修改原字典	性能表现（大致）
`update()`	否	是	中等
`{a, b}`	是	否	优秀
`a	b`	是	否

✅ 建议：在 Python 3.9+ 环境下，优先使用 | 操作符。

实际应用案例：配置合并系统

假设你正在开发一个应用，需要从多个来源加载配置：

default_config.py：默认配置
env_config.py：环境变量配置（如 prod、dev）
user_config.json：用户自定义配置

你可以这样设计合并逻辑：

DEFAULT_CONFIG = {
    'debug': False,
    'timeout': 30,
    'max_connections': 100,
    'log_level': 'INFO'
}

ENV_CONFIG = {
    'debug': True,
    'timeout': 60,
    'log_level': 'DEBUG'
}

USER_CONFIG = {
    'max_connections': 200,
    'custom_flag': True
}

final_config = DEFAULT_CONFIG.copy()
final_config.update(ENV_CONFIG)
final_config.update(USER_CONFIG)

print(final_config)

✅ 关键点：后合并的字典优先级更高，适合配置系统。

常见误区与注意事项

不要在循环中频繁使用 update() 修改原字典，容易引发意外副作用。建议先复制一份再操作。

| 操作符不能用于链式合并，必须逐个操作。例如：

# 错误写法
# dict1 | dict2 | dict3  # 会报错

# 正确写法
result = dict1 | dict2
result = result | dict3

字典解包不能用于非字典类型，例如 list 或 tuple，否则会报错。
合并嵌套字典时，| 和 update() 都是浅拷贝，内部对象不会被递归合并。

a = {'data': [1, 2]}
b = {'data': [3, 4]}

c = a | b
c['data'].append(5)
print(a['data'])  # 输出：[1, 2, 5] —— 原字典也被修改了！

🔥 解决方案：使用 copy.deepcopy() 或自定义递归合并函数。

结语

Python 合并字典是日常开发中高频操作。掌握多种方法，能让你在处理配置、数据聚合、API 响应合并等任务时更加高效和优雅。

从 update() 到 | 操作符，每种方式都有其适用场景。对于现代项目，强烈推荐使用 Python 3.9+ 的 | 操作符，代码更简洁，语义更清晰。

记住：合并不是简单的“加法”，而是有策略的选择。理解键冲突、深浅拷贝、性能差异，才能写出既安全又高效的代码。

无论你是初学者还是中级开发者，只要掌握了这些技巧，就能在项目中游刃有余地处理字典合并问题。