ROC曲线的样本量多大才合适?

如题所述

ROC曲线统计学方法对样本都没有什么最低要求,但是样本量过少将会影响ROC的准确度,其AUC可能不能完全准确的反应分类器的精确度。
40-50个样本在统计上属于小样本,t-检验,如果样本大于60或理想120以上,t分布就是正态分布了,所以40个样本在统计上是最小推断总体的样本,换句话说40-50个样本是介于小样本和正态分布大样本的临界样本量;如果不严格的话40个样本就可以;
当然,样本含量过大,会增加实际工作的困难,浪费人力,物力和时间,由于过分追求数量,可能会引入更多的混杂因素,从而影响数据的质量,从抽样误差的计算公式中可知:抽样误差的大小与样本含量的平方根成反比,但并非样本愈大愈有代表性,当样本含量增大到一定程度后,再继续增大样本含量,只会事倍功半,得不偿失 虽然样本含量愈大,参数的估计愈精确,但实际工作中常常由于各方面条件的限制,总希望样本含量不要太多,因而必须正确合理地估计样本含量,可以按照不同的检验水准确定样本含量。
温馨提示:答案为网友推荐,仅供参考
相似回答