agentmentoragentmentor

第 05 节:不用查表的第一把尺:68-95-99.7

本节 objectives:

  • 能说出经验法则的三个比例:约 68%、95%、99.7%
  • 能把平均数和标准差转换成具体区间
  • 能判断一个正态数据点是否罕见

先修: 正态曲线、标准差 | 上一节: << 04 | 下一节: 06 >>

正态曲线上,标准差不只是单位

对近似正态分布的数据,经验法则说:约 68% 的数据落在平均数左右 1 个标准差内,约 95% 落在 2 个标准差内,约 99.7% 落在 3 个标准差内12。这不是所有分布都成立的法则,它依赖“近似正态”。

讲解

先把区间写出来

如果平均数是 70,标准差是 10:

  • 1 个标准差内:60 到 80。
  • 2 个标准差内:50 到 90。
  • 3 个标准差内:40 到 100。

然后再贴比例:约 68%、95%、99.7%。

曲线两侧要平分

因为正态曲线对称,平均数左右各占一半。若 95% 在 2 个标准差内,那么大约 5% 在两端外侧,左右各约 2.5%。

经验法则是估算,不是精确查表

经验法则适合快速判断“常见不常见”。如果需要精确概率,通常要查标准正态表或用计算器。

跟我做一遍(worked example)

题目:成年男性某项指标近似正态,平均数 100,标准差 15。估算 70 到 130 之间的人占多少。

  1. 找中心:平均数 100。
  2. 看距离:70 比 100 低 30,130 比 100 高 30。
  3. 换成标准差数:30 / 15 = 2,所以区间是平均数左右 2 个标准差。
  4. 用经验法则:约 95% 的人落在这个区间。

解释:70 和 130 不是随便两个数,它们正好是 mean ± 2 sd

换你补全(faded example)

某考试分数近似正态,平均数 80,标准差 5。

问题区间约占比例
平均数左右 1 个标准差____ 到 ________
平均数左右 2 个标准差____ 到 ________
高于 90 分90 是平均数以上 ____ 个标准差;上尾约 ____

答案:75 到 85,约 68%;70 到 90,约 95%;90 是平均数以上 2 个标准差,上尾约 2.5%。

小结 + 通向下一节

经验法则把标准差变成了比例估算工具。下一节学习 z-score:不用每次说“高于平均数 2 个标准差”,而是直接写成一个标准化分数。

Footnotes

  1. OpenStax Introductory Business Statistics 2e: Using the Normal Distribution — https://openstax.org/books/introductory-business-statistics-2e/pages/6-2-using-the-normal-distribution

  2. Khan Academy: Normal distributions and the empirical rule — https://www.khanacademy.org/math/statistics-probability/modeling-distributions-of-data/more-on-normal-distributions/a/normal-distributions-and-the-empirical-rule

练习

练习 · Level 1:区间转换

某城市某月每日最高温近似正态,平均 24°C,标准差 4°C。写出 1、2、3 个标准差内的温度区间和大约比例。

提示 1

先算 24 ± 4,再算 24 ± 824 ± 12

自评
练习 · Level 2:常见错误剖析

错误说法:“如果 95% 在 2 个标准差内,那高于平均数 2 个标准差的人有 5%。”请指出错在哪里。

提示 1

正态曲线是对称的,两端平分尾部。

看参考答案

2 个标准差外总共约 5%,分在左右两端;高于平均数 2 个标准差的右尾约 2.5%。