如果数据不服从正态分布怎么计算置信区间

如题所述

第一个就是log转化,能把一些金额数据转化的比较正太。第二个是使用分位,把原来的数据转化为rank的排列。第三个是标准化,转化之后解释就从原始值每单位变动变为每一个标准差变动。比较神奇的还有什么cox-box转化之类的。

使用Excel中CONFIDENCE.T(alpha,standard_dev,size)函数。使用学生的t分布返回总体平均值的置信区间。alpha=0.15,standard_dev=1346.84,size=16

CONFIDENCE.T=510.87。

平均值=41116.88

置信区间=41116.88±510.87

扩展资料

举例:

总体不服从正态分布,且已知总体标准差为500,样本容量为35,平均值为8900,置信水平为95%。总体不服从正态分布、方差未知的情况,通常是以样本方差S^2估计总体方差。

然后计算总体平均值的置信区间,这时所构造的统计量不服从标准正态分布。而是服从自由度为n-1的t分布,所以你的答案应该是8900±1.69*500/√35。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-12-19

计算公式

置信区间的计算公式取决于所用到的统计量。置信区间是在预先确定好的显著性水平下计算出来的,显著性水平通常称为α(希腊字母alpha),如前所述,绝大多数情况会将α设为0.05。置信度为(1-α),或者100×(1-α)%。于是,如果α=0.05,那么置信度则是0.95或95%,后一种表示方式更为常用 [2]  。置信区间的常用计算方法如下:

Pr(c1<=μ<=c2)=1-α

其中:α是显著性水平(例:0.05或0.10);

Pr表示概率,是单词probablity的缩写;

100%*(1-α)或(1-α)或指置信水平(例如:95%或0.95);

表达方式:interval(c1,c2) - 置信区间。

扩展资料

求解步骤

第一步:求一个样本的均值

第二步:计算出抽样误差。经过实践,通常认为调查:100个样本的抽样误差为±10%;500个样本的抽样误差为±5%;1200个样本时的抽样误差为±3%。

第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。

如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之2.5(假设分布是对称的)。

如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信区间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。

对置信区间的计算通常要求对估计过程的假设(因此属于参数统计),比如说假设估计的误差是成正态分布的。

置信区间只在频率统计中使用。在贝叶斯统计中的对应概念是可信区间。但是可信区间和置信区间是建立在不同的概念基础上的,因此一般上说取值不会一样。 置信空间表示通过计算估计值所在的区间。 置信水平表示准确值落在这个区间的概率。 

置信区间表示具体值范围,置信水平是个概率值。例如:估计某件事件完成会在10~12日之间,但这个估计准确性大约只有80%:表示置信区间(10,12),置信水平80%。要想提高置信水平,就要放宽置信空间。 

置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

参考资料来源:百度百科-置信区间

参考资料来源:百度百科-置信度

本回答被网友采纳
第2个回答  2015-08-29
你好!如果样本容量较大(30个以上),仍然可以按照正态总体的公式求期望的置信区间,原因是根据中心极限定理,大样本时,样本平均值近似服从正态分布。经济数学团队帮你解答,请及时采纳。谢谢!本回答被提问者和网友采纳
相似回答