pearson和spearman适用条件

如题所述

相关分析说明

相关分析一般是研究定量数据和定量数据的相关性,以及变量之间存在相关性,相关程度是如何的,比如研究身高和体重之间是否有关联等等。

相关分析数据格式

在进行数据分析之前都需要将数据整理成正确的数据格式然后在进行分析,那么相关分析的数据格式是什么样的呢?如下说明:

相关分析的数据格式为一个分析项为一列,比如上图中研究身高和体重,则身高为一列、体重为一列。

Pearson相关系数也叫皮尔逊积矩相关系数,通常用r表示,使用pearson相关系数,数据需要满足:

    线性

    正态分布

    没有异常值

    如果不满足条件可以考虑使用spearman相关系数,以及pearson相关系数的计算如下:

Speaman计算公式如下:

针对pearson相关系数不能识别非线性关系以及并且对一个或者几个异常值比较敏感,此时可以使用spearman相关系数进行替代,spearman相关系数有时也被称为级别相关系数或者秩相关系数,该相关系数是根据两个变量的秩进行相关分析,spearman相关系可以用来衡量两个变量之间是否存在单调相关关系。当值为1时说明一个变量随着一个变量单调递增,当值为-1时,说明一个变量随着另一个变量单调递减。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-01-31

1、定义不同

Pearson相关系数被定义为他们的协方差除以标准差的乘积;Spearman相关性系数被定义为秩(有序)变量之间的Pearson相关系数。

2、线性不同

pearson相关系数是线性相关关系。spearman相关系数呈现非线性相关。pearson相关系数是线性相关关系。spearman相关系数呈现非线性相关。

3、连续性不同

pearson相关系数呈现连续型正太分布变量之间的线性关系。spearman相关系数不要求正太连续,但至少是有序的。pearson相关系数呈现连续型正太分布变量之间的线性关系。spearman相关系数不要求正太连续,但至少是有序的。

4、使用情况不同

pearson相关是最常见的相关公式,用于计算连续数据的相关,比如计算班上学生数学成绩和语文成绩的相关可以用Pearson相关。

而spearman相关是专门用于分析顺序数据的,就是那种只有顺序关系,但并非等距的数据,比如计算班上学生数学成绩排名和语文成绩排名的关系。

相似回答