卡方检验的用代码实现卡方检验

如题所述

在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别? 处理 发癌数 未发癌数 合计 发癌率% 甲组 52 19 71 73.24 乙组 39 3 42 92.86 合计 91 22 113 80.53 52 19
39 3
这是表中最基本的数据,因此上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*(91/113)=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。
卡方检验要求:最好是大样本数据。一般每个个案最好出现一次,四分之五的个案至少出现五次。如果数据不符合要求,就要应用校正卡方。
利用统计学软件分析结果如下:
data kafang;
input row column number @@;
cards;
1 1 52
1 2 19
2 1 39
2 2 3
;
run;
proc freq;
tables row*column/chisq;
weight number;
run; 统计量 自由度 值 概率 卡方 1 6.4777 0.0109(显著) 似然比卡方 1 7.3101 0.0069 连续校正卡方 1 5.2868 0.0215 Mantel-Haenszel 卡方 1 6.4203 0.0113 Phi 系数  -0.2394  列联系数  0.2328  Cramer 的 V  -0.2394

温馨提示:答案为网友推荐,仅供参考
相似回答