如何分析数据的集中趋势和离散趋势?

如题所述

一、集中趋势

集中趋势是指一组数据所趋向的中心数值。对集中趋势的度量就是采用具体的统计方法和统计测度对这一中心数值的测量和计量,以一个综合数值来表述数据所趋向的这一中心数值的一般水平。

二、离散趋势

在统计学上描述观测值偏离中心位置的趋势,反映了所有观测值偏离中心的分布情况。

异众比率用于评价众数的代表性测度。异众比率越接近1,众数的代表性越弱。四分位差是指上四分位数与下四分位数的绝对离差。平均差是指全部变量值与均值离差的绝对值的均值。

平均差以均值为中心,通过每个变量值与均值的绝对距离反应数据离散程度的测度。方差是指全部变量值与其均值的离差平方的均值。标准差是方差的算术平方根。离散系数是指同一总体的标准差与均值的比较。标准化值是以变量值与其均值的差除以同一数据的标准化的比值。

集中趋势和离散程度是关于数据分布的基本测度,要进一步描述数据分布的形态是否偏倚,偏倚的方向和程度;分布是尖耸还是扁平,尖耸或扁平的程度,以及数据分布形态与正态分布的差异等,还需要对数据分布的偏态和峰度进行测量。

扩展资料

一、描述集中趋势的统计量

统计学中常用平均数来描述一组变量值的集中位置或平均水平。常用的统计量指标有算数均数、几何均数、中位数和百分位数

1、算数均数:即为均数,用以反映一组呈对称分布的变量值在数量上的平均水平。

2、几何均数:常用以反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。

3、中位数:适用于偏态分布资料和一端或两端无确切的数值的资料。是第50百分位数

4、百分位数:为一界值,用以确定医学参考值范围。

二、描述离散趋势的统计量

离散趋势是反映资料的变异程度,常用指标有极差、四分位间距、方差与标准差、变异系数

1、极差:为一组数据的最大值和最小值之差,但极差不能反映所有数据的变异大小,且极易受样本含量的影响。常用以描述偏态分布。

2、四分位数间距:它是由第3四分位数与第1四分位数相减得到,常和中位数一起描述偏态分布资料的分布。

3、方差与标准差:反映一组数据的平均离散水平,消除了样本含量的影响,常和均数一起用来描述一组数据中的离散和集中趋势。

4、变异系数:多用于观察指标单位不同时,可消除因单位不同而不能进行比较的困难。

参考资料来源:百度百科-集中趋势

参考资料来源:百度百科-离散趋势

温馨提示:答案为网友推荐,仅供参考
相似回答