agentmentoragentmentor

第 04 节:正态曲线:平均数旁边的钟形山

本节 objectives:

  • 能说出正态分布曲线的中心、对称性和面积含义
  • 能在曲线上标出平均数与 1、2、3 个标准差位置
  • 能解释为什么标准差控制曲线的宽窄

先修: 平均数、标准差 | 上一节: << 03 | 下一节: 05 >>

标准差开始变成一把横向尺

正态分布是一条钟形、对称的曲线,中心在平均数处;NIST 的工程统计手册把正态分布列为最重要、最常用的连续分布之一,并用均值和标准差两个参数刻画它的位置与尺度1

讲解

曲线的中心:平均数

在正态分布中,曲线关于平均数对称。平均数左边和右边各占总面积的一半。这里的“面积”表示比例或概率:曲线下总面积是 12

曲线的宽窄:标准差

如果平均数相同,标准差小的曲线更窄、更高;标准差大的曲线更宽、更平。标准差越大,数据越可能散到离平均数更远的位置。

标准正态分布

一种特殊正态分布的平均数是 0,标准差是 1,叫标准正态分布。z-score 会把任意正态分布中的位置转换到这条标准尺上3

跟我做一遍(worked example)

题目:某考试分数近似服从正态分布,平均数 70,标准差 10。请在数轴上标出中心和几个关键位置。

  1. 平均数:70,放在曲线最高处。
  2. 1 个标准差:70 - 10 = 60;70 + 10 = 80。
  3. 2 个标准差:50 和 90。
  4. 3 个标准差:40 和 100。

解释:60 到 80 是平均数左右各 1 个标准差的区域;50 到 90 是左右各 2 个标准差的区域。下一节会把这些区域对应的人群比例估出来。

换你补全(faded example)

某机器生产的零件长度近似正态,平均长度 100 mm,标准差 3 mm。

位置数值
平均数____
平均数 - 1 个标准差____
平均数 + 1 个标准差____
平均数 - 2 个标准差____
平均数 + 2 个标准差____

答案:100;97;103;94;106。

小结 + 通向下一节

正态曲线用平均数定中心,用标准差定横向尺度,用曲线下面积表示比例。下一节用经验法则快速估算:有多少数据会落在平均数周围 1、2、3 个标准差内。

Footnotes

  1. NIST/SEMATECH e-Handbook of Statistical Methods: Normal Distribution — https://www.itl.nist.gov/div898/handbook/eda/section3/eda3661.htm

  2. OpenStax Introductory Business Statistics 2e: Using the Normal Distribution — https://openstax.org/books/introductory-business-statistics-2e/pages/6-2-using-the-normal-distribution

  3. NIST/SEMATECH e-Handbook of Statistical Methods: Standard Normal Distribution — https://www.itl.nist.gov/div898/handbook/eda/section3/eda3671.htm

练习

练习 · Level 1:画一条粗略曲线

在纸上画一条钟形曲线,中心写 50,标准差写 5。标出 45、55、40、60。

提示 1

不要追求画得漂亮,关键是位置关系。

自评
练习 · Level 2:解释宽窄

两门考试平均数都为 70。甲考试标准差 5,乙考试标准差 15。哪门考试成绩更分散?曲线形状有什么差别?

提示 1

标准差是横向尺度,不是中心。

看参考答案

乙更分散;乙的曲线更宽、更平,甲的曲线更窄、更高。