我通过将数据集一分为二,在 azure ML studio 中构建了一个二类决策森林模型。
我对模型评分和评估感到满意,因此我引入了一个新的数据集(具有相同的变量、相同的数据类和相同的源)进行评分。
然后我收到一个错误,即新评分数据集中的变量不是分类的,我应该使用“编辑元数据”将其设为分类(我不确定为什么)。我这样做了,这立即使评分后的模型评估非常差。
如何解决这个问题?
我想到但无法弄清楚的一个解决方案是避免使用“编辑元数据”功能,这样我就可以获得与分割数据评估相同的结果。
错误消息:
Error: Error 1000: AFx Library library exception: Feature 'Age' is of type: 'Numeric' which is not implicitly convertible to type: 'Categorical'. Please use the Metadata editor to explicitly convert the type.
最佳答案
我不确定您使用的是什么算法,但系统所说的是它需要一个分类值来计算其内部参数。
您获得的低分可能与新数据库和您用于获得分数的模型有关。编辑元数据模块不应影响性能。
关于Azure:决策林模型评分问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37388295/