蛋蛋的奥数 | AI 数学伴侣

在统计中，我们常常无法调查整个总体（比如全校学生的身高），于是通过抽取一部分个体组成样本，用样本的数据来估计总体的情况。这种做法叫“用样本估计总体”。

关键在于：样本要有代表性。如果样本只来自某一个班级、某一性别或某一年级，那它可能不能反映全校的真实情况，这样的估计就会有偏差。

即使样本具有代表性，由于随机性，样本统计量（如样本平均数 $\bar{x}$ ）和总体参数（如总体平均数 $\mu$ ）之间仍可能存在差异，这种差异称为抽样误差。样本越大，通常误差越小，估计越可靠。

例如，若从1000名学生中随机抽取100人测身高，计算出平均身高为160 cm，我们可以用160 cm作为全校学生平均身高的估计值。但要注意：这只是估计，真实值可能略高或略低，这就是误差。

样本平均数： $\bar{x} = \frac{1}{n}(x_1 + x_2 + \cdots + x_n)$
示例：5个学生的成绩为80, 85, 90, 75, 95，则 $\bar{x} = \frac{80+85+90+75+95}{5} = 85$ 。
用样本比例估计总体比例：若样本中有 $k$ 个个体具有某特征，样本容量为 $n$ ，则总体中该特征的比例可估计为 $\hat{p} = \frac{k}{n}$ 。
示例：抽查200盏灯，发现10盏不合格，则不合格率估计为 $\hat{p} = \frac{10}{200} = 0.05$ （即5%）。

例题1（基础）：某校有1200名学生。为了解他们每天锻炼的时间，随机抽取60名学生调查，得到平均每天锻炼时间为35分钟。问：能否用这个结果估计全校学生平均锻炼时间？为什么？

解题过程：

例题2（进阶）：某工厂一天生产10000个零件。质检员随机抽取200个检测，发现有8个次品。（1）估计这批零件的次品率；（2）若有人质疑：“只查了200个，不准！”，你如何回应？

解题过程：（1）样本中次品数 $k=8$ ，样本容量 $n=200$ ，次品率估计为 $\hat{p} = \frac{8}{200} = 0.04 = 4\%$ 。

（2）回应要点：