VI评估指标是什么?

如题所述

MobTech的特征筛选(SAAS)基于用户提供的业务场景样本与MobTech 4000+标签体系,通过随机森林与逻辑回归两种基础模型建模,并提供混淆矩阵、KS、AUC、IV等评估指标,帮助用户筛选出最适合样本业务场景的优质标签。


IV的全称是Information Value,中文意思是信息价值,或者信息量。


首先需要对计算的特征进行分组处理,也叫离散化,之后进行每组的WOE计算,WOE的全称是“Weight of Evidence”,即证据权重。计算公式对于第i组

是这个组中是模型为1的个体占所有为1的比例,是这个组中为0占样本中所有预测为0的比例,是这个组中为1的数量,是这个组中为0的数量,是样本中所有为1的数量,是样本中所有为0的数量。

接下来对每个分组进行的

计算:

工程实现上进行了更改:

这个特征的IV值为

温馨提示:答案为网友推荐,仅供参考
相似回答