控制变量是否应该显著

如题所述

控制变量的显著性,我们几乎不能inerpret.在你选定了相关变量和控制变量以后,控制变量就来服务的,你怕ui这个随机变量里面含有和有关变量相关的部分,也就是Xi Ui不是独立的,然后你能做的就是找到对被解释变量有影响并比较易获的数据,ui里去除这部分(ui 和Xi2线性表示)再用一个Vi 去表示新的你认为比较纯净的随机变量。所以才会引入控制变量保证那个你在意的变量的系数 无偏就好,至于控制变量的情况,你还需要更多的信息。不可能有统一的控制变量选择标准。原因1 就像你说的,你的控制变量可能不显著,你可以设置很多组控制变量,相互组合,你基本上没办法选择哪一更优秀,但是你可以做出自己的想法,因为你是基于你选择的基础上做出一定判断,别人并不一定认同。原因2每个人对控制变量的理解不一样,就像interaction varaiables,到底影响相关变量的因素是什么呢,只要XiXj相关性不为零,对于期望值都会有偏向,所以也不好说到底怎么做。但是至少控制变量的引入可以部分的达到我们的要求。保证Variables of interest 的哪个系数无偏,当然实证会有一定差距,但是数学理论上说明我们的方向是正确的。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-11-06
控制变量法是指把多因素的问题变成多个单因素的问题,而只改变其中的某一个因素,从而研究这个因素对事物影响,分别加以研究,最后再综合解决的方法。控制变量法是科学探究中的重要思想方法,广泛地运用在各种科学探索和科学实验研究之中。

控制变量法的运用
数学
  变数或变量,是指没有固定的值,可以改变的数。变量以非数字的符号来表达,一般用拉丁字母。变量是常数的相反。变量的用处在于能一般化描述指令的方式。如果只能使用真实的值,指令只能应用于某些情况下。变量能够作为某特定种类的值中任何一个的保留器。

  变量用于开放句子,表示尚未清楚的值(即变数),或一个可代入的值(见函数)。这些变量通常用一个英文字母表示,若用了多于一个英文字母,很易令人混淆成两个变量相乘。n,m,x,y,z是常见的变量名字,其中n,m较常表示整数。

物理
  物理学中对于多因素(多变量)的问题,常常采用控制因素(变量)的方法,把多因素的问题变成多个单因素的问题。每一次只改变其中的某一个因素,而控制其余几个因素不变,从而研究被改变的这个因素对事物的影响,分别加以研究,最后再综合解决,这种方法叫控制变量法。它是科学探究中的重要思想方法,广泛地运用在各种科学探索和科学实验研究之中。

  1.独立变量,即一个量改变不会引起除因变量以外的其他量的改变。只有将某物理量由独立变量来表达,由它给出的函数关系才是正确的。

  2.非独立变量,一个量改变会引起除因变量以外的其他量改变。把非独立变量看做是独立变量,是确定物理量间关系的一大忌。

  正确确定物理表达式中的物理量是常量还是变量,是独立变量还是非独立变量,不但是正确解答有关问题的前提和保障,而且还可以简化解答过程。

  方法点播:当一个问题与多个因素有关时,探究该问题与其中某个因素的关系时,通常采用控制变量法。
第2个回答  2020-11-06
首先,线性回归没有“自变量之间互相独立”这个基本假设,高斯马尔科夫假定只要求任何两个不能完全线性相关,换言之,只要不完全相关就不会影响估计值的BLUE性。
多重共线性不好,只是因为它会导致估计量标准差被高估,使得显著性等参数不可信。
所以多重共线性是有成本的,但不足以构成拒绝添加一些变量的充分理由。

你举的那个例子,avg_ed变量的确不应该添加,但这不是因为多重共线性,而是因为它所包含的信息——父母受教育水平——已经被完全包含在其他几个变量中了,因而从理论上说,添加这个变量没有好处。因而在权衡取舍之后,我们不应当添加这个变量。

相反,如果某个变量包含了重要的信息,从理论上讲就与被解释变量十分相关,那我们就绝不能因为多重共线性就从回归中剔除掉它。

回到题主的例子。从题主给出的信息看,这新变量必须添加。
原因很简单,题主说它有一定必要性,亦即它与被解释变量相关;然后它又与要观测的变量相关。在这种情况下,如果不在回归中纳入这么变量,那就意味着它被遗漏在残差项中,会造成残差与被解释变量相关。这将直接导致回归结果有偏,这是远比多重共线性更严重的问题,这才是计量最忌讳的问题。
第3个回答  2020-11-06
一般相关只是单独地分析两个变量之间的相关,它不会去控制其他变量的影响。
回归的话如果你放入多个自变量做回归,那么你看到的某一个自变量的回归系数其实代表的是控制了其他自变量(也就是减去了其他自变量对因变量的效应)后的回归,也就是说,他并不代表该变量单独对因变量的影响。
差别就在于是否控制了所关注变量外的其他变量
相似回答