Python statistics.harmonic_mean() 方法（最佳实践）

Python statistics.harmonic_mean() 方法详解：理解调和平均数的实际应用

在数据分析的世界里，平均数并不仅仅是“把数字加起来除以个数”这么简单。我们常见的算术平均数（mean）、中位数（median）、众数（mode），每一种都有其适用场景。而今天要聊的这个函数——statistics.harmonic_mean()，正是一个容易被忽视但非常实用的工具。

你可能听说过“调和平均数”这个概念，但它到底有什么用？什么时候该用它而不是算术平均数？别急，这篇文章会带你一步步揭开它的面纱，用真实案例和代码演示，让你真正掌握 Python statistics.harmonic_mean() 方法的精髓。

什么是调和平均数？它的数学意义是什么？

调和平均数是一种特殊的平均值，适用于处理“速率”或“比率”的问题。它的公式是：

H = n / (1/x₁ + 1/x₂ + ... + 1/xₙ)

其中 n 是数据个数，x₁ 到 xₙ 是各个数值。

听起来有点抽象？我们用一个生活化的例子来理解：

想象你开车去一个地方，前半程以 60 公里/小时行驶，后半程以 40 公里/小时行驶。你可能会想：“平均速度是不是 (60 + 40) / 2 = 50 公里/小时？”——错了！

因为你在不同速度下行驶的时间不同。真正应该用调和平均数来计算平均速率。

我们来算一下：

假设总路程为 120 公里，每段 60 公里。
第一段用时：60 / 60 = 1 小时
第二段用时：60 / 40 = 1.5 小时
总时间：2.5 小时
平均速度：120 / 2.5 = 48 公里/小时

而调和平均数：2 / (1/60 + 1/40) = 2 / (0.0167 + 0.025) ≈ 48 公里/小时

✅ 完美匹配！这说明：当处理“单位时间完成的工作量”“速度”“效率”这类比率问题时，调和平均数才是正确的选择。

如何在 Python 中使用 statistics.harmonic_mean() 方法？

Python 的 statistics 模块为我们提供了 harmonic_mean() 方法，它能自动帮你计算一组数值的调和平均数，且会自动处理边界情况。

基本语法

from statistics import harmonic_mean

harmonic_mean(data)

data：必须是包含数字的可迭代对象（如列表、元组、集合等）
返回值：调和平均数（浮点数）
注意：数据中不能包含 0 或负数，否则会抛出 StatisticsError

简单示例

from statistics import harmonic_mean

speeds = [60, 40]

avg_speed = harmonic_mean(speeds)

print(f"调和平均速度：{avg_speed:.2f} 公里/小时")

✅ 注释：这里我们传入的是两个速度值，函数自动应用调和平均公式，结果为 48，与手动计算一致。

为什么调和平均数比算术平均数更“公平”？

我们来对比一下算术平均数和调和平均数在不同场景下的差异。

案例：两个工人完成相同任务的时间

假设两位工人完成同一个任务所需时间如下：

工人	完成时间（小时）
A	2
B	3

算术平均时间：(2 + 3) / 2 = 2.5 小时
调和平均时间：2 / (1/2 + 1/3) = 2 / (0.5 + 0.333) ≈ 2.4 小时

看起来差别不大，但问题在于：算术平均数假设两人工作时间相同，而调和平均数考虑的是“单位时间内完成的工作量”。

我们换个角度看：谁的效率更高？

A 的效率：1 / 2 = 0.5 个任务/小时
B 的效率：1 / 3 ≈ 0.333 个任务/小时

调和平均数实际上是“平均效率”的倒数，所以它更合理地反映了整体效率。

代码验证

from statistics import harmonic_mean

times = [2, 3]

avg_time = harmonic_mean(times)

print(f"调和平均完成时间：{avg_time:.2f} 小时")

arithmetic_mean = sum(times) / len(times)
print(f"算术平均完成时间：{arithmetic_mean:.2f} 小时")

✅ 注释：调和平均时间更接近实际合作效率，因为它考虑了“单位时间产出”，适合评价工作效率。

实际应用场景：股票投资中的平均成本计算

在投资领域，调和平均数也有重要应用。比如：定投策略中，如何计算平均买入成本？

假设你分三次买入某只股票，价格分别为：

第一次：10 元/股
第二次：15 元/股
第三次：20 元/股

每次投入相同金额，比如 1000 元。

那么你买入的股数分别是：

第一次：1000 / 10 = 100 股
第二次：1000 / 15 ≈ 66.67 股
第三次：1000 / 20 = 50 股

总投入：3000 元
总股数：100 + 66.67 + 50 = 216.67 股
平均成本：3000 / 216.67 ≈ 13.85 元/股

现在我们用 statistics.harmonic_mean() 来验证：

from statistics import harmonic_mean

prices = [10, 15, 20]

avg_cost = harmonic_mean(prices)

print(f"调和平均价格（即平均成本）：{avg_cost:.2f} 元/股")

✅ 注释：当每次投入金额相同时，调和平均数正好等于平均成本。这正是为什么定投策略中推荐使用调和平均的原因。

常见错误与注意事项

虽然 statistics.harmonic_mean() 很好用，但使用时有几个关键点必须注意：

1. 不能包含 0 或负数

调和平均数的公式中有除法（1/x），如果 x 为 0，就会导致除零错误。

from statistics import harmonic_mean

data_with_zero = [10, 20, 0, 30]

try:
    result = harmonic_mean(data_with_zero)
except ValueError as e:
    print(f"错误：{e}")

✅ 注释：遇到 0 或负数，函数会抛出 ValueError，必须提前检查数据有效性。

2. 数据数量必须大于 0

empty_data = []

try:
    harmonic_mean(empty_data)
except ValueError as e:
    print(f"错误：{e}")

✅ 注释：空列表无法计算，必须确保输入数据至少有一个有效值。

性能对比：调和平均 vs 算术平均 vs 几何平均

为了更直观地理解它们的差异，我们来做一个对比测试：

from statistics import harmonic_mean, mean, geometric_mean

data = [10, 20, 30, 40, 50]

h_mean = harmonic_mean(data)
a_mean = mean(data)
g_mean = geometric_mean(data)

print("三种平均数对比：")
print(f"调和平均数：{h_mean:.2f}")
print(f"算术平均数：{a_mean:.2f}")
print(f"几何平均数：{g_mean:.2f}")

输出结果：

三种平均数对比：
调和平均数：20.00
算术平均数：30.00
几何平均数：26.05

✅ 注释：这三者的关系是：调和平均数 ≤ 几何平均数 ≤ 算术平均数（当所有数相等时三者相等）。调和平均数最小，因为它对小数值更敏感。

总结：什么时候该用 Python statistics.harmonic_mean() 方法？

经过以上讲解，我们可以总结出几个典型使用场景：

✅ 计算平均速度（如往返路程、变速行驶）
✅ 评估工作效率（单位时间完成任务数）
✅ 定投策略中的平均成本
✅ 网络带宽、数据传输速率的平均值
✅ 财务分析中“倍数”类指标的平均

📌 小贴士：当你看到“每单位时间完成多少”“每单位成本能买多少”“每公里耗油量”这类问题时，优先考虑调和平均数。

Python 的 statistics.harmonic_mean() 方法，正是为这类问题量身打造的工具。它不仅简化了计算，还避免了因误用算术平均数而带来的结果偏差。

掌握这个方法，不仅能让你的代码更专业，还能在实际项目中做出更准确的分析判断。下次遇到“平均”问题时，别急着用 sum() / len()，先问问自己：这是速率问题吗？是的话，就用调和平均数！

扩展思考：调和平均数在机器学习中的应用

虽然调和平均数在日常开发中不常见，但在一些指标中却至关重要。比如在机器学习中，F1 分数就是精确率（Precision）和召回率（Recall）的调和平均数：

F1 = 2 × (P × R) / (P + R)

这说明：当一个模型的精确率和召回率差异较大时，F1 分数会显著拉低，从而提醒我们“不能只看一个指标”。这也正是调和平均数的智慧所在——它更关注“最差的那个”，确保整体表现不被极端值掩盖。

所以，即使你不是做数据分析，理解调和平均数也能帮助你更深入地理解算法和指标的本质。