函数名称:VAR_SAMP
var_samp([distinct] expr)
功能描述
VAR_SAMP 函数用于计算一组数值数据的样本方差。方差是衡量数据分布离散程度的统计量,它可以反映数据的波动性大小。通过计算方差,我们可以了解数据的变化趋势和波动范围。
参数说明
expr
:数值类型,可以是 tinyint、smallint、int、bigint、float、double 或 decimal 类型。
distinct
(可选):表示计算去重后的集合方差。如果不设置该参数,则计算包含重复值的集合方差。
返回结果
- 返回 double 类型的数值,表示计算得到的样本方差。
- 如果传入的参数包含 null 值,则 null 值不参与计算。
使用示例
- 计算包含重复值的样本方差:
SELECT var_samp(col) FROM VALUES (1), (2), (3), (3), (null) AS tab(col);
+--------------------+
| `var_samp`(col) |
+--------------------+
| 0.9166666666666666 |
+--------------------+
- 计算去重后的样本方差:
SELECT var_samp(DISTINCT col) FROM VALUES (1), (2), (3), (3), (null) AS tab(col);
+--------------------------+
| `var_samp`(DISTINCT col) |
+--------------------------+
| 1.0 |
+--------------------------+