第 06 节:z-score:把不同尺子上的数放到同一条线上
本节 objectives:
- 能计算 z-score:
z = (x - mean) / sd- 能解释 z-score 的正负号和大小
- 能用 z-score 比较不同分布中的位置
先修: 标准差、正态曲线、经验法则 | 上一节: << 05 | 下一节: (无)
85 分到底好不好,要看它在哪个分布里
同样是 85 分,如果考试平均 80、标准差 5,它是平均数以上 1 个标准差;如果平均 60、标准差 25,它也是平均数以上 1 个标准差。z-score 把“离平均数多远”写成标准差的倍数,使不同量纲可以比较12。
讲解
公式只有一个动作:先减中心,再除尺度
z = (x - mean) / sd
先用 x - mean 看这个值在平均数上方还是下方;再除以标准差,把普通距离换成“几个标准差”。
正负号和大小
z 为正,说明观测值高于平均数;z 为负,说明低于平均数;z 的绝对值越大,离平均数越远。z = 0 表示正好等于平均数。
与经验法则连起来
在近似正态分布中,z 在 -1 到 1 之间大约覆盖 68%;z 在 -2 到 2 之间大约覆盖 95%;z 超过 2 或低于 -2 就已经在相对少见的尾部。
跟我做一遍(worked example)
题目:小林数学 88 分,班级平均 80,标准差 4。英语 92 分,班级平均 84,标准差 8。哪科相对表现更突出?
- 数学 z-score:
(88 - 80) / 4 = 2。 - 英语 z-score:
(92 - 84) / 8 = 1。 - 比较:数学高出平均数 2 个标准差;英语高出 1 个标准差。
- 结论:虽然英语原始分更高,数学的相对位置更突出。
这就是 z-score 的用处:把不同平均数、不同标准差的分数放到同一条标准尺上。
换你补全(faded example)
两个跑步成绩都要和各自组内比较。
哪一项相对更突出?为什么?
答案:速度 z = (76 - 70) / 3 = 2;耐力 z = (84 - 78) / 6 = 1。速度相对更突出,因为它高出组平均 2 个标准差。
小结 + 通向下一节
z-score 是标准化位置:先离开平均数多少,再换成标准差的倍数。到这里,你已经能从一组数据的离散程度出发,走到正态曲线、经验法则和跨尺度比较。
Footnotes
-
NIST/SEMATECH e-Handbook of Statistical Methods: Standard Normal Distribution — https://www.itl.nist.gov/div898/handbook/eda/section3/eda3671.htm ↩
-
Khan Academy: Z-scores review — https://www.khanacademy.org/math/statistics-probability/modeling-distributions-of-data/z-scores/a/z-scores-review ↩
练习
计算以下 z-score,并写一句解释:
x=110, mean=100, sd=10x=85, mean=100, sd=5x=42, mean=42, sd=6
提示 1
先算分子,再除以标准差。
某公司两个指标:响应时间越低越好,满意度越高越好。A 团队响应时间 180ms,行业平均 220ms,标准差 20ms;满意度 86,行业平均 80,标准差 3。哪个指标相对更突出?
提示 1
z 的正负只表示高低,不自动表示好坏;好坏要看指标语义。
看参考答案
响应时间 z = (180 - 220) / 20 = -2,因为越低越好,所以这是好方向的 2 个标准差;满意度 z = (86 - 80) / 3 = 2。两者相对突出程度相近,但方向解释不同。