Excel 数据分组双利器:GROUPBY 与 FREQUENCY 函数详解
这是一篇关于 Excel 中 GROUPBY 和 FREQUENCY 函数的详细教学教程。这两个函数都用于数据分组统计,但它们的应用场景、功能和用法有显著不同。
第一部分:强大的新函数 —— GROUPBY (适用于 Microsoft 365)
GROUPBY 函数是 Microsoft 365 新引入的动态数组函数,它极大地简化了基于现有“字段”进行分组和聚合计算的过程,可以看作是无需创建透视表的公式化透视表。
1. 函数语法
=GROUPBY(row_fields, values, function, [field_headers], [total_depth], [sort_order], [filter_array])
参数解释:
- row_fields (必需):要进行分组的一个或多个列/数组。这是你的“类目”或“条件”。
- values (必需):要对其进行聚合计算的一个或多个列/数组。
- function (必需):对 values 执行的聚合函数。例如 SUM, AVERAGE, COUNT, MAX, MIN 等。
- [field_headers] (可选):一个数字,指定源数据是否包含标题。
- 缺失:自动 (默认)
- 0:否
- 1:是,不显示
- 2:否,但生成
- 3:是并显示
- [total_depth] (可选):指定是否显示总计。
- 0:无总计。
- 1:显示行总计(默认)。
- 2:显示总计(一个大总计)。
- [sort_order] (可选):指定结果的排序方式(升序 1 或降序 -1)。
- [filter_array] (可选):一个布尔数组(TRUE/FALSE),用于在分组前筛选源数据。
2.使用案例
假设我们有如下销售数据(A1:C11):
示例1:按地区计算总销售额
=GROUPBY(A2:A11, C2:C11, SUM,3)
- A2:A11:按“地区”分组。
- C2:C11:对“销售额”进行聚合。
- SUM:聚合方式为求和。
- 3:表示原表格有表头并显示
结果将自动溢出到下方的单元格:
示例2:按地区和产品计算平均销售额(多条件分组)
=GROUPBY(A2:B11, C2:C11, AVERAGE, 1, 1)
- A2:B11:同时按“地区”和“产品”两个字段分组。
- C2:C11:对“销售额”求平均。(North苹果有两个销售额一个100,一个200,平均为150)
- 1:源数据有标题。
- 1:显示行总计。
结果将自动溢出到下方的单元格:
示例3:使用筛选和排序
假设我们只想看“苹果”的销售情况,并按销售额从高到低排序。
- 先创建筛选数组:在 D1 单元格输入公式 =B1:B11="苹果",这会得到一个 TRUE/FALSE 数组。
- 使用 GROUPBY:
=GROUPBY(A1:A11, C1:C11, SUM, 3, 1, -1, D2#)
- 第六参数[sort_order] -1:对结果(销售额总和)进行降序排列。
- 第七参数[filter_array] D2#:使用上一步创建的溢出数组作为筛选条件,只处理 TRUE 的行。
第二部分:经典的频率统计函数 —— FREQUENCY
FREQUENCY 函数用于计算数值在指定区间( bins ) 内出现的频率。它非常适合制作频率分布直方图,例如统计考试成绩在各分数段的人数、员工年龄分布等。
1. 函数语法
=FREQUENCY(data_array, bins_array)
- data_array (必需): 要计算频率的原始数据数组或范围(一列数值)。
- bins_array (必需): 包含区间分隔点(上限)的数组或范围(一列数值)。
2.使用案例
假设我们有如下学生成绩表 (A1:B11),如下图;我们想统计成绩在以下区间的人数:
- 0-59: 不及格
- 60-79: 中等
- 80-89: 良好
- 90-100: 优秀
(1)设置区间分隔点
bins_array 定义的是区间的上限。我们需要在 D2:D4 设置分隔点,如下图;(注意:最后一个区间是 > 最大值),
(2)输入公式
=FREQUENCY(B2:B11,D2:D5)
- 再F2上输入如上公式,统计结果如上图,如使用的版本支持动态数组,直接按 Enter 可自动溢出,如是老版本的按 Ctrl + Shift + Enter 组合键确认。
- 必须理解 bins_array 是上限的含义。
- 它只返回计数,无法像 GROUPBY 那样进行求和、平均等其他聚合操作。
第三部分:对比与总结
特性 | GROUPBY | FREQUENCY |
主要用途 | 按类别字段分组聚合(求和、平均、计数等) | 按数值区间统计频率(计数) |
输入数据 | 类别列、数值列 | 单一数值列、区间上限列 |
输出内容 | 聚合结果(和、平均值等) | 计数(频次) |
输出方式 | 动态溢出数组 | 静态数组公式 (需选择区域并按 C+S+E) |
分组依据 | 其他列的唯一值 | 自定义的数值区间 |
多功能聚合 | 支持 (可配合HSTACK等实现) | 不支持 (仅能计数) |
版本要求 | Microsoft 365 | 所有Excel版本 |
如何选择?
- 当你需要按类别(如销售员、部门、产品类型) 对数值进行汇总(如求和、平均) 时,优先使用 GROUPBY。它是公式版的透视表,功能强大且灵活。
- 当你需要分析数值本身的分布情况,统计落在特定区间(如分数段、年龄区间) 内的数量时,必须使用 FREQUENCY。它是制作分布图表的基石。
希望这篇教程能帮助你更好地理解和运用这两个强大的分组统计工具!