关于stata的一些问题,求解答

有几个问题:
1.如果知道出生日期和调日期,怎么算出年龄?
2.merge的用法,如果我要根据hhid和line两个变量合并表格,合并之后出现的_merge==1,2,3各是什么意思?哪些是完全不匹配的?我的第一个表格是所有人的,第二个是有工资的,第三个是从事农业获得收入的,该怎么和第一个合并?第二个和第三个表格之间应该是没有重叠的。
3.进行回归的时候需不需要对缺省值进行处理?
4.怎样看到一个变量在各个数值的分布?比如性别,怎么看到男女各多少
5.虚拟变量在回归的时候怎么用?
谢谢~

第1个回答  2012-12-19
1、如是1990年10月2日生,则年龄是
di (date(c(current_date),"DMY")-date("1990-10-2","YMD"))/365.25
2、_merge =1说明只在当前文件中 , =2说明只在使用的合并文件中, =3说明数据匹配
3、这个要看数据和你的样本
4、用tab 命令即可
5、虚拟变量一般来说用在发生截距或者斜率可能变动的时候
比如有季节效应,那么就要加入虚拟追问

谢谢~~我要把另外两个表格和当前的合并,是不是应该把只在另外两个表格中的去掉?

追答

什么意思?

追问

那个问题我已经解决了,谢谢哈~我现在想问一下,如果建一个新变量,新变量的值是原来几个变量和,那如果几个变量中有缺省值,新变量计算的时候是把缺省值当0还是新变量也变成缺省值?

追答

多个变量相加,那变成缺失值
同一列的相加,为0
你自己简单的模拟下就行
很好理解

相似回答