SQL聚合函数:SUM与COUNT的区别

在 SQL 中,SUMCOUNT(*)COUNT(1)COUNT(column) 都是聚合函数,但它们的作用和计算逻辑有本质区别:


1. SUM(column)

  • 作用:对指定列的所有非 NULL 数值求和。
  • 特性
    • 仅适用于数值类型列(如 INT, FLOAT 等)。
    • 忽略 NULL,仅计算有效数值。
  • 示例
    -- 假设表 sales 有列 amount: [100, NULL, 50]
    SELECT SUM(amount) FROM sales; -- 结果:150
    

2. COUNT(*)

  • 作用:统计表中总行数(包括所有列值为 NULL 的行)。
  • 特性
    • 不关心具体列内容,直接计数所有行。
    • 性能通常最优(数据库引擎会优化)。
  • 示例
    -- 假设表 sales 有 3 行(其中一行全为 NULL)
    SELECT COUNT(*) FROM sales; -- 结果:3
    

3. COUNT(1)

  • 作用:统计表中总行数(等价于 COUNT(*))。
  • 特性
    • 1 是一个常量表达式,不引用任何列。
    • 执行结果和性能与 COUNT(*) 完全相同(现代数据库优化后无差别)。
  • 示例
    SELECT COUNT(1) FROM sales; -- 结果:3(与 COUNT(*) 一致)
    

为什么 COUNT(*)COUNT(1) 一样?
数据库引擎在处理时,二者都会被优化为直接统计行数,无需检查列值。优先推荐 COUNT(*)(语义更明确)。


4. COUNT(column)

  • 作用:统计指定列中非 NULL 值的数量
  • 特性
    • 仅计数该列不为 NULL 的行。
    • 如果列包含 NULL,结果会小于 COUNT(*)
  • 示例
    -- 假设表 sales 有列 product: ["A", NULL, "B"]
    SELECT COUNT(product) FROM sales; -- 结果:2(忽略 NULL)
    

⭐ 关键区别总结

函数作用是否忽略 NULL性能建议
SUM(column)对数值列求和忽略 NULL 值仅用于数值列
COUNT(*)统计所有行数不忽略 NULL 行✅ 优先使用
COUNT(1)统计所有行数(同 COUNT(*)不忽略 NULL 行= COUNT(*)
COUNT(column)统计列的非 NULL 值数量忽略 NULL 值需注意 NULL 影响

🚨 常见误区

  1. COUNT(*) vs COUNT(1)

    • 二者性能无差异,但 COUNT(*) 更符合语义(统计行数)。
  2. COUNT(column) 可能返回比预期小的值

    • 如果列包含 NULL,结果会减少,例如:
      -- 表中 100 行,其中 10 行 column_x 为 NULL
      COUNT(*)      --> 100
      COUNT(column_x) --> 90
      
  3. COUNT 与字符串/日期列

    • COUNT(column) 可用于任何数据类型(不限于数字),但仍会忽略 NULL

💡 使用建议

  • 统计总行数 → COUNT(*)
  • 统计某列有效值数量 → COUNT(column)(注意 NULL 影响)
  • 避免 COUNT(非索引列) 对大表扫描,可考虑用索引列替代优化性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

代码的余温

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值