如何计算随机森林中的 变量重要性?

在随机森林的分类器中(random forest),应该如何计算其中的变量重要性啊(variable importance)? 知道的高手请给下具体的公式。

首先对于每棵树,每次利用Bootstrap方法抽取样本进行训练,但是有1/3的数据没有抽取到,这样的数据成为袋外数据OOB(out of bag),将OOB带入决策树中,计算出误差error1,对OOB中所有样本的特征X对应的值进行噪声干扰,即随机改变特征的值,再将数据带入决策树中,计算出误差error2。对于N棵树,计算出变量X的重要性为error2-error1的均值
温馨提示:答案为网友推荐,仅供参考
第1个回答  推荐于2016-12-01
分类器是一种计算机程序。
他的设计目标是在通过学习后,可以自动的对给定的数据进行分类。
应用在搜索引擎以及各种检索程序中。同时也大量应于于数据分析与预测领域。本回答被提问者采纳
相似回答