怎样检查数据是否符合正态分布?

如题所述

怎样检查数据是否符合正态分布?

在数据分析过程中,往往需要数据服从正态分布,正态分布,也称“常态分布”,又名高斯分布,在求二项分布的渐近公式中得到。很多方法都需要数据满足正态分布,比如方差分析、独立t检验、线性回归分析(因变量)等。如果说没有这个前提可能会导致分析不严谨等等。所以进行数据正态性检验很重要。

一般常用的三种正态性检验的方法,分别是描述法、正态性检验以及图示法,其中图示法包括直方图以及P-P/Q-Q图。比如使用SPSSAU进行直方图,结果如下:

直方图若呈现‘中间高,两边低,左右基本对称的钟形图’则基本服从正态分析,但是数据量过少等也可能影响结果导致很难呈现出标准的正态分布,如果是这种情况如果看见‘钟形’也可以可以接受的。上图可以看出,数据呈现的分布并不对称,但是也出现近似‘钟形’曲线,所以也可以勉强接受。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-07-30

如果 Anderson-Darling 值较小,则表明分布与数据拟合得更好。P值取决于你的风险承受能力,一般认为置信度是0.95,即P值>0.05时,我们认为符合正态分布。

Anderson-Darling拟合优度检验是一种检验所收集的数据是否服从某个分布(如正态分布、指数分布、韦伯分布等等)的一种方法,是一种非参数检验方法。

注意:

类似的方法还有Shapiro-Wilk检验、Kolmogolov-Smirnov检验等。其原理是将所收集的数据从小到大排列,得出经验累积分布(ECDF),并与目标分布的理论累积分布(CDF)进行比较,得出所谓的AD*统计量,这个统计量越小,数据的分布就越接近目标分布,越大则数据服从目标分布的可能性就越小。

具体的判断就是根据AD*统计量的分布计算出p值,如果p值大于0.05,则数据服从目标分布,如果p值小于0.05,则数据不服从目标分布。

相似回答