中心极限定理

如题所述

第1个回答  2022-07-24
中心极限定理: 在任意一个总体中随机抽取样本量为n的样本,抽m次,分别求出每次抽取样本的平均值,这些平均值的分布接近于正态分布

数学表达式:

设从均值为 ,方差为 (有限的)一个总体中抽取样本量为n的样本,当n充分大时,样本均值 的抽样分布近似服从均值为μ、方差为 的正态分布。

成立条件:

(1)每次的抽样都是独立的,互不影响的;

(2)N充分大时,抽取的样本量要大于等于30(即n 30);

(3)抽样观察的数值分布不能强烈歪斜(样本数量越大,对歪斜程度的容忍度越高);

独立同分布随机变量服从同一分布,并且相互独立,那么,随机变量是独立同分布的。

独立: 指随机变量是相互独立的,即,每次抽样的结果,不会相互影响,即这次的抽样结果不会对下一次的抽样结果有影响,抽样的结果可能相同,也可能不相同(比如:掷硬币、摇骰子)

同分布: 指随机变量有着相同的分布参数、相同的分布函数、相同的期望和方差。

SD 和SE的关系及区别:

SD(样本标准差): 某一次抽样中,每个样本对样本平均值之间的离散程度

SE(样本标准误): 多次抽样后,样本平均值对总体平均值之间的离散程度

区别: SD是描述个体之间的变异程度;SE是描述样本平均值之间的误差,对一组抽样数据可靠性的估计(标准误越小,说明样本平均值与总体平均值越接近,否则,表明样本平均数比较离散)。

关系: 标准差是  ,标准误是  ,标准误是标准差的  ;二者都是衡量样本变量随机性的指标,只是从不同角度来反映误差。

常见的应用:

用户对产品的满意度调研:XX公司想知道某产品的用户对服务的满意度,我们需要知道用户对产品服务满意度的打分情况,然后,算出满意度平均值,该平均值就可以代表用户对产品服务的满意度。产品的用户是个很大的数字,不可能做到一个一个的去调查;但,我们可以去选择进行抽样调查。假如,该产品的用户为100万,我们开始随机抽样,每次抽样样本量为100个,调查出100个人的满意度的平均值,做10次的抽样调查(也可以做更多次的抽样调查),我们可以根据中心极限定理发现,这10次的满意度平均值和该产品的满意度平均值很近似。
相似回答