5.6 两个总体均值之差的区间估计

如题所述

第1个回答  2022-06-18
分为三种情况:独立大样本、独立小样本、配对样本

独立大样本前提下,两个样本均值之差 服从期望值为 ,方差为 的正态分布。

因此,置信水平为1-α的置信区间为  。

当总体的 未知时,使用样本方差 代替,区间变为

2.1 当总体的方差已知

此时估计公式跟大样本时一毛一样

2.2 当总体的方差未知

2.2.1 当两个总体的 方差相等

① 使用两个样本的方差共同估计总体的方差,公式为

② 样本均值之差标准化后服从自由度为 的t分布,标准化的方式为 ~ 

③ 得出 的置信水平为1-α的置信区间为 

2.2.2 当两个总体的 方差不相等

① 样本均值之差标准化后近似服从自由度为v的t分布,v的计算公式为

② 然后 的置信水平为1-α的置信区间为

至于为什么,我也不知道~

先说下什么叫配对样本。假设我们想估计中国人的平均身高和平均体重的差(两个总体均值之差的估计问题)。一种采样方式是,我们随机找了1W个人采集了他们的身高,得到了身高的一个样本,又随机找了1W个(也可以是2W个)人的体重,得到了体重的一个样本。然后我们就可以研究均值之差了。上面这种采样方式,叫独立样本。

另一种方式,我们随机找了1W个人,采集了他们的身高,又采集了他们的体重。这样得到的身高和体重的样本就叫配对样本。

基于配对样本估计总体均值之差时,可以先在微观上作差,然后基于这些差值构成的集合进行估计。描述如下:

① 先得到由差值构成的集合;

② 计算其均值 ;

③ 若已知差值的标准差为 ,则 服从正态分布, 的置信水平为1-α的置信区间为

④ 若差值的标准差未知,则用样本差值的标准差 代替,即

⑤ 上述估计是基于大样本,若是小样本+总体为正态分布的情况,对应的区间为
相似回答