python – 在scikits机器学习中缺少值

在scikit学习中是否有可能缺少值?他们应该如何代表?我找不到任何文件。
在scikit学习中根本不支持缺少的值。以前有关于这个邮件列表的讨论,但是没有尝试实际编写代码来处理它们。

无论你做什么,不要使用NaN编码丢失的值,因为许多算法拒绝处理包含NaN的样本。

以上答案已经过时了scikit-learn的最新版本有一个类Imputer,它执行简单的每个功能的缺失值插补。你可以给它包含NaNs的数组,让它们被相应特征的平均值,中值或模式所取代。

http://stackoverflow.com/questions/9365982/missing-values-in-scikits-machine-learning

本站文章除注明转载外,均为本站原创或编译
转载请明显位置注明出处:python – 在scikits机器学习中缺少值