方差与标准差

📘 数据的分析·
⭐⭐
·计算公式、意义

🎯 学习目标

  • 理解方差和标准差的意义,知道它们是用来衡量数据波动大小的统计量
  • 掌握方差和标准差的计算公式,并能正确进行计算
  • 能通过比较两组数据的方差或标准差,判断哪组数据更稳定

📚 核心概念

在数据分析中,我们不仅关心一组数据的平均数(集中趋势),还关心这些数据彼此之间相差有多大,也就是数据的“波动”或“离散程度”。

方差就是用来衡量这种波动大小的一个重要指标。它的基本思想是:先算出每个数据与平均数的差(叫“偏差”),再把这些偏差平方后求平均。平方是为了避免正负偏差相互抵消。

设有 nn 个数据 x1,x2,,xnx_1, x_2, \dots, x_n,它们的平均数是 xˉ\bar{x},那么这组数据的方差记作 s2s^2,计算公式为:

s2=1ni=1n(xixˉ)2 s^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

因为方差的单位是原数据单位的平方(比如身高单位是厘米,方差单位就是平方厘米),不太直观,所以人们又定义了标准差,它是方差的算术平方根:

s=s2 s = \sqrt{s^2}

标准差和原始数据单位一致,更容易理解。方差或标准差越小,说明数据越集中、越稳定;越大则说明数据越分散、波动越大。

📝 关键公式

  • 方差公式s2=1ni=1n(xixˉ)2s^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

    • 示例:数据为 2, 4, 6,平均数 xˉ=4\bar{x}=4,方差 s2=(24)2+(44)2+(64)23=4+0+43=83s^2 = \frac{(2-4)^2 + (4-4)^2 + (6-4)^2}{3} = \frac{4+0+4}{3} = \frac{8}{3}
  • 标准差公式s=s2s = \sqrt{s^2}

    • 示例:上例中方差为 83\frac{8}{3},标准差 s=831.63s = \sqrt{\frac{8}{3}} \approx 1.63

💡 经典例题

例题1(基础):某小组5名同学的数学测验成绩为:80, 85, 90, 95, 100。求这组数据的方差和标准差。

  1. 先求平均数:xˉ=80+85+90+95+1005=4505=90\bar{x} = \frac{80+85+90+95+100}{5} = \frac{450}{5} = 90
  2. 计算每个数据与平均数的差的平方:
    • (8090)2=100(80-90)^2 = 100
    • (8590)2=25(85-90)^2 = 25
    • (9090)2=0(90-90)^2 = 0
    • (9590)2=25(95-90)^2 = 25
    • (10090)2=100(100-90)^2 = 100
  3. 求方差:s2=100+25+0+25+1005=2505=50s^2 = \frac{100+25+0+25+100}{5} = \frac{250}{5} = 50
  4. 求标准差:s=507.07s = \sqrt{50} \approx 7.07

例题2(应用):甲、乙两名射击运动员各射靶5次,成绩如下:

  • 甲:9, 8, 9, 10, 9
  • 乙:7, 10, 8, 10, 10 谁的成绩更稳定?

  1. 分别计算两人的平均数:
    • 甲:xˉ=9+8+9+10+95=9\bar{x}_甲 = \frac{9+8+9+10+9}{5} = 9
    • 乙:xˉ=7+10+8+10+105=9\bar{x}_乙 = \frac{7+10+8+10+10}{5} = 9
  2. 计算方差:
    • 甲:s2=(99)2+(89)2+(99)2+(109)2+(99)25=0+1+0+1+05=0.4s_甲^2 = \frac{(9-9)^2 + (8-9)^2 + (9-9)^2 + (10-9)^2 + (9-9)^2}{5} = \frac{0+1+0+1+0}{5} = 0.4
    • 乙:s2=(79)2+(109)2+(89)2+(109)2+(109)25=4+1+1+1+15=1.6s_乙^2 = \frac{(7-9)^2 + (10-9)^2 + (8-9)^2 + (10-9)^2 + (10-9)^2}{5} = \frac{4+1+1+1+1}{5} = 1.6
  3. 比较:s2<s2s_甲^2 < s_乙^2,说明甲的成绩波动更小,更稳定。

⚠️ 易错点

  • 忘记先求平均数:计算方差前必须先算出平均数 xˉ\bar{x},不能直接用原始数据相减。
  • 混淆样本方差与总体方差:初中阶段通常使用 1n\frac{1}{n} 的公式(总体方差),不要误用高中才学的 1n1\frac{1}{n-1}(样本方差)。
  • 忽略平方导致符号错误:偏差 (xixˉ)(x_i - \bar{x}) 可能是负数,但平方后一定是非负数,不能漏掉平方。
  • 标准差写成负数:标准差是方差的算术平方根,结果一定 ≥ 0,不能写负值。
  • 单位混淆:方差单位是原单位的平方,标准差单位与原数据一致,解释时要注意区分。