相关性检验-Pearson相关系数

如题所述

在探索变量间关系的统计学工具箱中,皮尔逊相关系数(Pearson correlation coefficient)占据着核心地位,尤其适用于分析两个连续型数据(具备双变量正态分布)之间的关联强度。这个指标,通常以ρ(rho)表示,其公式为:


ρ = (cov(x, y)) / (σx * σy)


这里的cov(x, y)指的是x和y的协方差,它是衡量两个随机变量间变化趋势同步程度的关键指标。值得注意的是,协方差本身受变量尺度影响,因此通过标准化(除以各自的标准差之积)得到的皮尔逊相关系数ρ,它的范围是固定的,从-1到1,涵盖了完全负相关、无相关和完全正相关三种情况。


通常,我们将皮尔逊系数分为几个等级来解读其相关性强度:ρ ≈ -1 表示极强负相关,ρ ≈ 0 表示无明显相关性,ρ ≈ 1 则表示极强正相关。这些等级可以进一步细分,如ρ > 0.9 为极强相关,0.7 < ρ < 0.9 为强相关,0.5 < ρ < 0.7 为中度相关,0.3 < ρ < 0.5 为弱相关,ρ ≈ 0.3 以下为极弱相关或无相关。


实际案例揭秘

设想一位研究者想要探究健康成年人体重(wt, 单位kg)与双肾脏总体积(volume, 单位ml)之间的关系。在对24位健康成年人的数据进行分析时,他们观察到如下的数据分布图,试图揭示两者之间的潜在关联。


计算步骤

首先,计算出协方差,然后分别求出体重和肾脏体积的标准差,再将这些数值代入皮尔逊相关系数的公式,得出精确的ρ值。例如,我们看到在SPSS的原始数据分析中,通过双变量(皮尔逊)检验,得到了显著的ρ值为0.947,这表明体重和双肾体积之间存在极强的正相关。


统计学检验

在SPSS的输出结果中,p值为0.000,远小于0.05的显著性水平。这意味着我们有理由拒绝零假设,即Pearson相关系数为零,而接受备择假设,即存在统计学意义上的相关性。这个p值的重要性不言而喻,它证实了体重和肾脏体积之间的关联并非偶然,而是具有可靠的数据支持。

温馨提示:答案为网友推荐,仅供参考
相似回答