回归模型中,“控制年度和行业”是什么意思

最近看经管类的论文,进行回归分析时经常出现“控制年度”“控制行业”是类似表述,请问这是什么意思?是说分行业分年度分别进行回归吗?这种控制能用什么软件实现?SPSS可以吗?

在回归分析加入年度变量和行业变量。

多元回归分析的X变量一般分为两种:解释变量和控制变量,解释变量往往是论文中作者希望关注的变量,而控制变量则是也可以影响Y变量、X变量,但是并不是作者需要研究的变量,但是为了研究的严谨必须也考虑。

回归模型(regression model)对统计关系进行定量描述的一种数学模型。如多元线性回归的数学模型可以表示为y=β0+β1*x+εi,式中,β0,β1,…,βp是p+1个待估计的参数,εi是相互独立且服从同一正态分布N(0,σ2)的随机变量,y是随机变量;x可以是随机变量,也可以是非随机变量,βi称为回归系数,表征自变量对因变量影响的程度。

SPSS可以实现这种回归,绝大多数的统计软件都可以。

扩展资料:

使用回归分析的好处良多。具体如下:

1、它表明自变量和因变量之间的显著关系;

2、它表明多个自变量对一个因变量的影响强度。

3、回归分析也允许我们去比较那些衡量不同尺度的变量之间的相互影响,如价格变动与促销活动数量之间联系。这些有利于帮助市场研究人员,数据分析人员以及数据科学家排除并估计出一组最佳的变量,用来构建预测模型。

参考资料:百度百科-回归模型

温馨提示:答案为网友推荐,仅供参考
第1个回答  推荐于2017-11-29
一般是指多元回归中将年度变量和行业变量加入回归。
多元回归分析的X变量一般分为两种:解释变量和控制变量,解释变量往往是论文中作者希望关注的变量,而控制变量则是也可以影响Y变量、X变量,但是并不是作者需要研究的变量,但是为了研究的严谨必须也考虑。
打个比方,假设我的Y变量是看“工资”,我的研究希望探究“性别变量”怎样影响“工资”,可是这里就有两个问题:第一,工资是随着时间变化的,过去的工资因为经济发展比较低而现在的工资高,男女加入工作的比例也是随着时间变化的,现在女性工作的更多;第二,工资是根据行业不同的,而男女的行业分布也往往不同。因此,如果不控制“年份”和“行业”两个变量,许多结论就无从下。例如我不控制行业和年份,得出了“工资女性较低,女性被歧视”的结论,有人可能就会反驳——女性在的行业往往是注重安稳而工资较低的,女性偏好安稳,因此并不是工资上有女性歧视,而是行业不同而已。所以为了真的发现女性是否被歧视,我就需要控制行业。比如看教师行业男性女性工资是否有统计差距?金融业?……
那么怎么控制行业呢?如果只有一个行业还好,可是行业很多,我们一个一个更改数据库做单变量回归是很没有效率的,这时我们就用到了多元回归的一个特性,每一个系数的含义是说:“控制其他加入多元回归的解释变量不变,这个解释变量变动1单位,则Y变动系数个单位”,因此我们就直接将行业变量(对行业变量的处理往往是考虑N个行业就加入N个不同变量,它们都是0、1的虚拟变量,0是指在这个行业里,1是指不在)和年份变量(直接加入时间变量)加入多元回归就可以得出“控制行业和年份”下的性别对工资的影响系数了。这样,我再分析出来就不会受到质疑。
实现这种回归,大部分统计软件都可以,包括SPSS,在写公式的时候按照我上述的方法在回归中添加入这些变量就可以了。追问

明白多了,谢谢~~那再问一下这个行业虚拟变量如何添加,在SPSS中是哪个命令呢?

追答

平时我用SPSS很少,所以具体的操作也不是很清楚,但是大概的要义是这样的
比如你有一个行业变量(只是举例):1=“教育业” 2=“医学类” 3=“公职类” 4=“其他”
那么你就需要设定三个虚拟变量(实际上应该是4个,但是回归中会因为多重共线性自动忽略一个,所以设定三个就足以)
虚拟变量1=1 if 行业变量=1;虚拟变量1=0 if行业变量!=1(不等于1)
虚拟变量2=1 if 行业变量=2;虚拟变量1=0 if行业变量!=2
虚拟变量3=1 if 行业变量=3;虚拟变量1=0 if行业变量!=3
然后将你新设计的这些变量加入多元回归就可以了。

本回答被提问者采纳
相似回答