PostgreSQL GROUP BY 语句（长文解析）

PostgreSQL GROUP BY 语句：从入门到实战

在日常数据处理中，我们常常需要对数据进行分类统计，比如“每个部门的员工人数是多少”、“每个月的销售额总和是多少”。这些需求，正是 PostgreSQL GROUP BY 语句的用武之地。它能让你把原始数据按某个或多个字段分组，然后对每组执行聚合操作，如求和、计数、取最大值等。

想象一下，你有一张员工表，里面记录了每个人的姓名、部门和薪资。如果你直接查询所有数据，看到的是零散的记录。但当你使用 GROUP BY 按“部门”分组，再配合 COUNT(*)，就能一眼看出哪个部门人最多。这就像把一堆杂乱的乐高积木，按颜色和形状归类整理，一眼就能看清每类有多少块。

PostgreSQL GROUP BY 语句是 SQL 中最核心的聚合工具之一，尤其适合处理分析类场景。掌握它，你就能从“看数据”升级到“用数据说话”。

GROUP BY 的基本语法与执行逻辑

在深入实战前，先来看一下最基础的语法结构：

SELECT 列名1, 聚合函数(列名2)
FROM 表名
GROUP BY 列名1;

这里的关键词顺序很关键，必须遵循：SELECT → FROM → GROUP BY 的顺序。注意，GROUP BY 不能出现在 WHERE 之后，也不能在 SELECT 里直接写未分组的字段（除非是聚合函数）。

举个例子，我们有一个名为 employees 的表，结构如下：

id	name	department	salary
1	张三	技术部	15000
2	李四	技术部	18000
3	王五	市场部	12000
4	赵六	市场部	14000
5	钱七	人事部	10000

现在我们要统计每个部门的员工人数，代码如下：

SELECT department, COUNT(*) AS employee_count
FROM employees
GROUP BY department;

代码注释：

department：我们要按“部门”字段进行分组
COUNT(*)：统计每组有多少条记录（即员工数）
AS employee_count：为结果列起一个别名，便于阅读
GROUP BY department：告诉数据库，按“部门”字段分组，每组独立计算

执行结果将是：

department	employee_count
技术部	2
市场部	2
人事部	1

这就是 GROUP BY 的核心逻辑：先分组，再聚合。就像把员工按部门“打包”，然后每包数人数。

多字段分组：让分类更精细

很多时候，单一字段分组不够用。比如，我们不仅想知道“各部门员工数量”，还想看“每个部门中男女员工各有多少”。这时就需要多字段分组。

假设 employees 表中新增一列 gender（性别）：

id	name	department	salary	gender
1	张三	技术部	15000	男
2	李四	技术部	18000	男
3	王五	市场部	12000	女
4	赵六	市场部	14000	女
5	钱七	人事部	10000	女

现在我们想统计“每个部门中男性和女性的人数”，代码如下：

SELECT department, gender, COUNT(*) AS count
FROM employees
GROUP BY department, gender;

代码注释：

GROUP BY department, gender：同时按“部门”和“性别”分组，形成多个组合组
例如：“技术部+男”、“市场部+女”等，每组独立统计
COUNT(*)：统计每组的记录数

执行结果：

department	gender	count
技术部	男	2
市场部	女	2
人事部	女	1

可以看到，多字段分组让数据分类更精准。你可以把它想象成“按部门和性别双重筛选”，形成一个二维分类表。

常用聚合函数搭配 GROUP BY

GROUP BY 通常与以下聚合函数配合使用，它们是数据统计的“标配”：

COUNT()：统计行数
SUM()：求和
AVG()：求平均值
MAX()：取最大值
MIN()：取最小值

比如，我们想知道每个部门的平均薪资和总薪资：

SELECT department,
       SUM(salary) AS total_salary,
       AVG(salary) AS avg_salary,
       COUNT(*) AS employee_count
FROM employees
GROUP BY department;

代码注释：

SUM(salary)：计算每组的薪资总和
AVG(salary)：计算每组的平均薪资（自动忽略 NULL 值）
COUNT(*)：统计每组的员工数
GROUP BY department：按部门分组

输出结果：

department	total_salary	avg_salary	employee_count
技术部	33000	16500.00	2
市场部	26000	13000.00	2
人事部	10000	10000.00	1

注意：聚合函数会自动忽略 NULL 值，比如某员工薪资为 NULL，它不会被计入 SUM 或 AVG 计算中。

配合 HAVING 进行分组后筛选

在使用 GROUP BY 时，我们常需要对“分组结果”再进行筛选。比如“只显示员工超过1人的部门”。

这时不能用 WHERE，因为 WHERE 在分组前执行，无法识别分组后的统计值。正确的方法是使用 HAVING。

SELECT department, COUNT(*) AS employee_count
FROM employees
GROUP BY department
HAVING COUNT(*) > 1;

代码注释：

HAVING COUNT(*) > 1：筛选出员工数量大于1的部门
HAVING 是专门用于分组后筛选的子句，作用类似于 WHERE，但针对的是“分组结果”
例如，人事部只有1人，不满足条件，不会出现在结果中

执行结果：

department	employee_count
技术部	2
市场部	2

对比：WHERE 用于筛选原始行，HAVING 用于筛选分组结果，这是初学者最容易混淆的地方。

实战案例：按月统计销售总额

假设我们有一个 sales 表，记录了每笔销售的日期和金额：

id	sale_date	amount
1	2024-01-05	200
2	2024-01-10	300
3	2024-02-03	400
4	2024-02-15	500
5	2024-03-01	600

现在我们要统计每个月的销售总额，并按月份升序排列：

SELECT EXTRACT(MONTH FROM sale_date) AS month,
       SUM(amount) AS total_sales
FROM sales
GROUP BY EXTRACT(MONTH FROM sale_date)
ORDER BY month;

代码注释：

EXTRACT(MONTH FROM sale_date)：从日期中提取月份（如 1 表示 1 月）
GROUP BY EXTRACT(MONTH FROM sale_date)：按提取出的月份分组
SUM(amount)：计算每组的销售额总和
ORDER BY month：对结果按月份排序，便于查看

输出：

month	total_sales
1	500
2	900
3	600

这个案例展示了 GROUP BY 在时间序列分析中的强大能力。通过提取时间维度（如年、月、日），我们可以轻松实现按周期统计。

常见错误与避坑指南

在使用 PostgreSQL GROUP BY 语句时，初学者容易犯几个典型错误：

SELECT 中出现未分组字段
错误示例：
```
SELECT department, name, COUNT(*) FROM employees GROUP BY department;
```
报错：name 未在 GROUP BY 中，且不是聚合函数。

正确做法：如果要显示非分组字段，必须用聚合函数，如 MAX(name)，或确保该字段在分组中唯一。
WHERE 写在 GROUP BY 之后
语法错误，顺序不能乱。WHERE 必须在 GROUP BY 前。
HAVING 误用为 WHERE
如果你想筛选“总销售额超过 1000 的月份”，必须用 HAVING，而不是 WHERE。
忽略 NULL 值的影响
COUNT(column) 会忽略 NULL，但 COUNT(*) 不会。注意区分。

总结与进阶建议

PostgreSQL GROUP BY 语句是数据分析的基础工具，掌握它，你就拥有了从“原始数据”提炼“洞察信息”的能力。无论是统计员工人数、分析销售趋势，还是做业务报表，它都不可或缺。

核心要点回顾：

GROUP BY 按指定字段分组，然后聚合
必须与聚合函数（如 COUNT、SUM）搭配使用
多字段分组可实现更细粒度分类
HAVING 用于筛选分组后的结果
注意字段顺序和 NULL 处理

建议初学者从简单的 COUNT 和 SUM 开始练习，逐步尝试多字段分组和时间维度分析。可以自己建一个测试表，模拟真实业务场景，边写边调试。

当你熟练使用 GROUP BY 后，可以进一步学习 WINDOW FUNCTIONS（窗口函数），它能让你在不破坏分组结构的前提下，实现更复杂的统计逻辑，比如“每组的占比”、“累计销售额”等。

数据不会说话，但你会用 SQL 让它开口。从今天开始，让 PostgreSQL GROUP BY 成为你分析数据的得力助手。