如何理解线性回归模型?

如题所述

为了确定两种或两种以上变量间相互依赖的定量关系,参数及非参数检验都不好使。这里就要用到回归分析。这里介绍简单的线性回归和Logistic回归在SPSS中怎么去做。
除了资料相互之间进行比较的统计学方法外,临床研究中还存在另外一种情况:研究2组资料之间是否相互联系。先看一个具体例子:
打开APP查看高清大图
12名大一女生体重与肺活量
这里,如果我们想要研究肺活量是否随体重变化而变化,就要用到统计学上一种重要的统计方法:回归分析。先看一个简单的方程式:ŷ=a+bx。怎么样?象不象初中学的最简单的一次函数?其实,这就是最简单的一次函数。只是统计学家们给它起了个高大上的名字:回归方程。如果将两个事物的取值分别定义为变量x和y,x为自变量,y为因变量,即y因为x的变化而变化。在上面这个例子中,体重就是x,而肺活量就是y。
一般而言,回归分析的数据需要满足以下四个条件:
1. 线性趋势:x和y的关系是线性的。如果不是,则不能进行线性回归分析;
2. 独立性:因变量y的取值相互独立,它们之间没有联系;
3. 正态性:因变量y的取值呈正态分布;
4. 方差齐性:因变量y的方差相同。
后两个条件其实没有这么重要。一般的临床研究只是建立回归方程,探讨x和y的关系,后两个条件不用管它们。那么如何判断x和y的关系是否是线性的呢?这就要用到另外一个重要的工具:散点图。散点图就是数据(x,y)在直角坐标系上的分布图。这其实也是初中代数的内容。
图1,图2和图3都有明显的线性关系。只不过图1,图2是直线,图3是曲线。而图4却杂乱无章,不成线性关系。所以,判断x和y的关系是否是线性关系就是做散点图。
现在市面上的统计学软件,比如SPSS,都可以做散点图和计算回归方程。我们只要输入一系列x值和y值。结果会输出a值和b值。就形成了一个回归方程。
上面那个例子:ŷ=0.000419+0.058826x。这里,如果b﹥0,则y随着x的增大而增大,反映在散点图上,就是一条斜向上的直线;如果b﹤0,则y随着x的增大而减小,反映在散点图上,就是一条斜向下的直线。∣b∣越大,y随x的变化越大,反映在散点图上,直线越陡峭。
另外,回归方程还可以揭示变量x对变量y 的影响大小,可以由回归方程进行预测和控制。即根据一个特定的x值,就可以计算出一个特定的y值。
温馨提示:答案为网友推荐,仅供参考
相似回答