第 05 节:不用查表的第一把尺:68-95-99.7
本节 objectives:
- 能说出经验法则的三个比例:约 68%、95%、99.7%
- 能把平均数和标准差转换成具体区间
- 能判断一个正态数据点是否罕见
正态曲线上,标准差不只是单位
对近似正态分布的数据,经验法则说:约 68% 的数据落在平均数左右 1 个标准差内,约 95% 落在 2 个标准差内,约 99.7% 落在 3 个标准差内12。这不是所有分布都成立的法则,它依赖“近似正态”。
讲解
先把区间写出来
如果平均数是 70,标准差是 10:
- 1 个标准差内:60 到 80。
- 2 个标准差内:50 到 90。
- 3 个标准差内:40 到 100。
然后再贴比例:约 68%、95%、99.7%。
曲线两侧要平分
因为正态曲线对称,平均数左右各占一半。若 95% 在 2 个标准差内,那么大约 5% 在两端外侧,左右各约 2.5%。
经验法则是估算,不是精确查表
经验法则适合快速判断“常见不常见”。如果需要精确概率,通常要查标准正态表或用计算器。
跟我做一遍(worked example)
题目:成年男性某项指标近似正态,平均数 100,标准差 15。估算 70 到 130 之间的人占多少。
- 找中心:平均数 100。
- 看距离:70 比 100 低 30,130 比 100 高 30。
- 换成标准差数:30 / 15 = 2,所以区间是平均数左右 2 个标准差。
- 用经验法则:约 95% 的人落在这个区间。
解释:70 和 130 不是随便两个数,它们正好是 mean ± 2 sd。
换你补全(faded example)
某考试分数近似正态,平均数 80,标准差 5。
答案:75 到 85,约 68%;70 到 90,约 95%;90 是平均数以上 2 个标准差,上尾约 2.5%。
小结 + 通向下一节
经验法则把标准差变成了比例估算工具。下一节学习 z-score:不用每次说“高于平均数 2 个标准差”,而是直接写成一个标准化分数。
Footnotes
-
OpenStax Introductory Business Statistics 2e: Using the Normal Distribution — https://openstax.org/books/introductory-business-statistics-2e/pages/6-2-using-the-normal-distribution ↩
-
Khan Academy: Normal distributions and the empirical rule — https://www.khanacademy.org/math/statistics-probability/modeling-distributions-of-data/more-on-normal-distributions/a/normal-distributions-and-the-empirical-rule ↩
练习
某城市某月每日最高温近似正态,平均 24°C,标准差 4°C。写出 1、2、3 个标准差内的温度区间和大约比例。
提示 1
先算 24 ± 4,再算 24 ± 8 和 24 ± 12。
错误说法:“如果 95% 在 2 个标准差内,那高于平均数 2 个标准差的人有 5%。”请指出错在哪里。
提示 1
正态曲线是对称的,两端平分尾部。
看参考答案
2 个标准差外总共约 5%,分在左右两端;高于平均数 2 个标准差的右尾约 2.5%。