stata怎么对教育程度赋值

如题所述

一般研究教育时候都是将它们处理成教育程度(高中低)的虚拟变量;或者按照受教育程度赋值:文盲=0;小学=6;初中=9;高中(职高,中专)=12;大学专科=14;大学本科=16;硕士及以上=19。这样就转化成了数值型变量。
拓展:变量粗略分三种:间距变量、比例变量、分类变量。
间距变量:数值能体现出相互之间的差距,相加减都有意义
比例变量:除了满足以上,还满足相除有意义,身高体重都不是比例变量,因为谁是谁体重身高几倍或者一点几倍没有意义。
分类变量:数值不能体现出相互差距。

受教育程度就属于分类变量。它只有类别的意义,你把他们命名为1-8,这并不能说明小学和文盲的差距与小学和初中的差距是相同的,后面也一样,他们之间的差距是不同的甚至不可衡量的;更不能说明高中和小学的差距是小学和文盲的差距的两倍。
如果你在做回归的时候把他们赋值为1-8,那么就会有上述的意义。解释的时候,你就要讲,当教育程度增加1时,收入(比如说)增加多少;增加2时又怎样。或者教育程度增加百分之1时怎样怎样,这些都是很荒谬的。
因为从小学跳到高中和从高中跳到大学虽然都是加一,但是差距不一样,造成的效果也不同。
所以,你应该做7个虚拟变量,不能用8个,为防止完全共线性。然后把这7个变量加进去。
温馨提示:答案为网友推荐,仅供参考
相似回答