有几个问题:
1.如果知道出生日期和调日期,怎么算出年龄?
2.merge的用法,如果我要根据hhid和line两个变量合并表格,合并之后出现的_merge==1,2,3各是什么意思?哪些是完全不匹配的?我的第一个表格是所有人的,第二个是有工资的,第三个是从事农业获得收入的,该怎么和第一个合并?第二个和第三个表格之间应该是没有重叠的。
3.进行回归的时候需不需要对缺省值进行处理?
4.怎样看到一个变量在各个数值的分布?比如性别,怎么看到男女各多少
5.虚拟变量在回归的时候怎么用?
谢谢~
谢谢~~我要把另外两个表格和当前的合并,是不是应该把只在另外两个表格中的去掉?
追答什么意思?
追问那个问题我已经解决了,谢谢哈~我现在想问一下,如果建一个新变量,新变量的值是原来几个变量和,那如果几个变量中有缺省值,新变量计算的时候是把缺省值当0还是新变量也变成缺省值?
追答多个变量相加,那变成缺失值
同一列的相加,为0
你自己简单的模拟下就行
很好理解