为什么对数据进行正态检验

如题所述

正态检验主要用于检验一个数据集是否服从正态分布,对数据进行统计分析之前,第一步就需要对数据进行 正态性检验 ,以检验该数据来自正态分布总体的概率有多大,再选择对应的参数或非参数检验方法进行分析。

检测数据正态性的方法有很多种,以下为几种常见方法介绍:图示法、统计检验法、描述法。

1、正态图:正态分布图可直观地展示数据分布情况,并结合正态曲线判断数据是否符合正态分布。若数据基本符合正态分布,则会呈现出中间高、两侧低、左右基本对称的“钟形”分布曲线;若数据为定类数据或数据量较少,一般很难呈现出标准的正态分布,只要图形呈现出“钟形”也可接受数据服从正态分布;若数据分布完全偏离正态,则说明数据不符合正态分布。

2、P-P图/Q-Q图:P-P图和Q-Q图,都是通过散点与正态分布的预测直线法重合程度以说明数据是否服从正态分布。P-P图是将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图,反映实际累积概率与理论累积概率的符合程度;Q-Q图将实际数据作为X轴,将对应正态分布分位数作为Y轴,作散点图,反映变量的实际分布与理论分布的符合程度。

3、正态性检验:利用统计图分析正态性,往往是依靠分析者的主观判断进行。因而容易产生结果偏差。因此需要结合其他方法,对数据的正态性指标进行统计描述。正态性检验分析定量数据是否具有正态分布特质。

4、描述法:描述法即通过描述数据偏度和峰度系数检验数据的正态性。偏度和峰度可通过描述性分析得到,也可在正态性检验中直接查看。理论上讲,标准正态分布偏度和峰度均为0,但现实中数据无法满足标准正态分布,因而如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。

正态检验的注意事项

1、检验数据正态性的方法有很多,其中统计检验法对于数据的要求最为严格,而实际数据由于样本不足等原因,即使数据总体正态但统计检验出来也显示非正态,实用性上不如图示法直观,接受程度高,因此一般情况下使用图示法相对较多。

2、当正态图和正态性检验结果出现矛盾,如正态图显示数据分布对称而正态性检验结果P<0.05,此时建议不要追求绝对的正态,如数据基本满足正态性即可接受服从正态分布。

3、正态性检验要求严格通常无法满足,如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。

温馨提示:答案为网友推荐,仅供参考
相似回答