agentmentoragentmentor

第 06 节:z-score:把不同尺子上的数放到同一条线上

本节 objectives:

  • 能计算 z-score:z = (x - mean) / sd
  • 能解释 z-score 的正负号和大小
  • 能用 z-score 比较不同分布中的位置

先修: 标准差、正态曲线、经验法则 | 上一节: << 05 | 下一节: (无)

85 分到底好不好,要看它在哪个分布里

同样是 85 分,如果考试平均 80、标准差 5,它是平均数以上 1 个标准差;如果平均 60、标准差 25,它也是平均数以上 1 个标准差。z-score 把“离平均数多远”写成标准差的倍数,使不同量纲可以比较12

讲解

公式只有一个动作:先减中心,再除尺度

z = (x - mean) / sd

先用 x - mean 看这个值在平均数上方还是下方;再除以标准差,把普通距离换成“几个标准差”。

正负号和大小

z 为正,说明观测值高于平均数;z 为负,说明低于平均数;z 的绝对值越大,离平均数越远。z = 0 表示正好等于平均数。

与经验法则连起来

在近似正态分布中,z 在 -1 到 1 之间大约覆盖 68%;z 在 -2 到 2 之间大约覆盖 95%;z 超过 2 或低于 -2 就已经在相对少见的尾部。

跟我做一遍(worked example)

题目:小林数学 88 分,班级平均 80,标准差 4。英语 92 分,班级平均 84,标准差 8。哪科相对表现更突出?

  1. 数学 z-score:(88 - 80) / 4 = 2
  2. 英语 z-score:(92 - 84) / 8 = 1
  3. 比较:数学高出平均数 2 个标准差;英语高出 1 个标准差。
  4. 结论:虽然英语原始分更高,数学的相对位置更突出。

这就是 z-score 的用处:把不同平均数、不同标准差的分数放到同一条标准尺上。

换你补全(faded example)

两个跑步成绩都要和各自组内比较。

项目你的成绩 x组平均 mean组标准差 sdz-score
100 米速度评分76703____
耐力评分84786____

哪一项相对更突出?为什么?

答案:速度 z = (76 - 70) / 3 = 2;耐力 z = (84 - 78) / 6 = 1。速度相对更突出,因为它高出组平均 2 个标准差。

小结 + 通向下一节

z-score 是标准化位置:先离开平均数多少,再换成标准差的倍数。到这里,你已经能从一组数据的离散程度出发,走到正态曲线、经验法则和跨尺度比较。

Footnotes

  1. NIST/SEMATECH e-Handbook of Statistical Methods: Standard Normal Distribution — https://www.itl.nist.gov/div898/handbook/eda/section3/eda3671.htm

  2. Khan Academy: Z-scores review — https://www.khanacademy.org/math/statistics-probability/modeling-distributions-of-data/z-scores/a/z-scores-review

练习

练习 · Level 1:三次计算

计算以下 z-score,并写一句解释:

  1. x=110, mean=100, sd=10
  2. x=85, mean=100, sd=5
  3. x=42, mean=42, sd=6
提示 1

先算分子,再除以标准差。

自评
练习 · Level 2:综合判断

某公司两个指标:响应时间越低越好,满意度越高越好。A 团队响应时间 180ms,行业平均 220ms,标准差 20ms;满意度 86,行业平均 80,标准差 3。哪个指标相对更突出?

提示 1

z 的正负只表示高低,不自动表示好坏;好坏要看指标语义。

看参考答案

响应时间 z = (180 - 220) / 20 = -2,因为越低越好,所以这是好方向的 2 个标准差;满意度 z = (86 - 80) / 3 = 2。两者相对突出程度相近,但方向解释不同。