随机森林产出解释

我为我的数据运行一个随机的森林,并以矩阵的形式得到输出。
它适用于分类的规则是什么?

附:我想要一个客户的配置文件作为输出,
例如来自纽约的人,在技术行业工作等

如何解释随机森林的结果?

最佳答案
查看每个树的应用规则

假设你使用randomForest包,这是如何访问森林中适合的树。

library(randomForest)
data(iris)
rf <- randomForest(Species ~ ., iris)
getTree(rf, 1)

这显示了500#的树1的输出:

   left daughter right daughter split var split point status prediction
1              2              3         3        2.50      1          0
2              0              0         0        0.00     -1          1
3              4              5         4        1.65      1          0
4              6              7         4        1.35      1          0
5              8              9         3        4.85      1          0
6              0              0         0        0.00     -1          2
...

您开始阅读描述根分割的第一行。根分裂基于变量3,即如果Petal.Length <= 2.50继续到左子节点(行2),并且如果Petal.Length> 2.50继续到右边的女儿节点(第3行)。如果一行的状态为-1,就像在第2行一样,这意味着我们已经到了一个叶子,并且将进行预测,在这种情况下是1级,即setosa。 实际上都是在手册中写的,所以看一下?randomForest和?getTree有更多的细节。 看整个森林的可变重要性 看看?重要性和?varImpPlot。这可以让您在整个森林中聚合的每个变量的单个分数。

> importance(rf)
             MeanDecreaseGini
Sepal.Length         10.03537
Sepal.Width           2.31812
Petal.Length         43.82057
Petal.Width          43.10046

转载注明原文:随机森林产出解释 - 代码日志