统计学的置信区间和显著差异怎么求

1、顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列; 第二种排队方式方法是:顾客在三个业务窗口处列队三排等待。已知两种排队方式的等待时间是正态总体,但总体方差不相等。为比较哪种排队方式方法等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间如下(单位:分钟):

方式1

6.5 6.6 6.7 7.0 7.1 7.3 7.4 7.7 7.7 7.7

方式2

4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0

要求:(保留四位小数点)
(1)构建两种排队方式等待时间所需平均值之差95%的置信区间。(5分)
(2)两种排队方式的等待时间有无显著差异()。(5分)

提示:

t-检验: 双样本异方差假设

变量 1

变量 2

平均

7.17

7.15

方差

0.2157

3.3183

观测值

10

10

假设平均差

0

df

10

t Stat

0.0336

P(T<=t) 单尾

0.4869

t 单尾临界

1.8125

P(T<=t) 双尾

0.9738

t 双尾临界

2.2281

1、求解置信区间主要步骤:

(1)求一个样本的均值。

(2)计算出抽样误差。经过实践,通常认为调查:100个样本的抽样误差为±10%;500个样本的抽样误差为±5%;1200个样本时的抽样误差为±3%。

(3)用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。

2、求解显著性差异的主要步骤:

(1)提出假设H0:Fn(x)=F(x)。

(2)给定一个显著水平α,例如100次试验中只有5次出现机会,则α=0.05。

(3)计算样本累计频率与理论分布累计概率的绝对差,令最大的绝对差为Dn;Dn=max{[Fn(x) - F(x)]}。

(4)用样本容量n和显著水平α查出临界值Dna。

(5)如果计算得出的D值大于Dα= 0.05这一阈值,可得出两个分布的差异在统计意义上是显著的。

扩展资料:

置信区间的理论描述:

置信区间是一种常用的区间估计方法,所谓置信区间就是分别以统计量的置信上限和置信下限为上下界构成的区间。

对于一组给定的样本数据,其平均值为μ,标准偏差为σ,则其整体数据的平均值的100(1-α)%置信区间为(μ-Ζα/2σ , μ+Ζα/2σ) ,其中α为非置信水平在正态分布内的覆盖面积 ,Ζα/2即为对应的标准分数。

对于一组给定的数据,定义其为观测对象,W为所有可能的观测结果,X为实际上的观测值,那么X实际上是一个值域在W 上的随机变量

这时,置信区间的定义是一对函数u(.) 以及v(.) 。实际上,若真实值为w,那么置信水平就是概率c:其中U=u(X)和 V=v(X)都是统计量(即可观测的随机变量),而置信区间因此也是一个随机区间:(U,V)。

温馨提示:答案为网友推荐,仅供参考
相似回答