我在使用 RapidMiner 导入 CSV 文件时遇到问题。 浮点值用逗号代替整数和小数值之间的分隔点。
有人知道如何正确导入以这种方式格式化的值吗?
示例数据:
BMI;1;0;1;1;1;蓝色;-0,138812155;0,520378909;5;0;50;107;0;9;0;其他;良好;2011
BMI;1;0;1;1;1;粉红色;-0,624654696;;8;0;73;120;1;3;0,882638889;其他;好;2011
Rapid miner 实际上将其解释为“多项式”。强制其为“真实”只会导致对“0”值的正确解释。
谢谢
最佳答案
这似乎是一个非常古老的请求。不确定这是否会对您有帮助,但这可能会对其他有类似情况的人有所帮助。
第 1 步:在“读取 CSV”操作符中的“导入配置向导”下,确保选择“分号”作为分隔符
第 2 步:使用“猜测类型”运算符。属性过滤器类型 -> 子集,选择属性 -> 选择属性 8、9 和 16(基于上面的示例),将“小数点字符”更改为“,”,您应该已全部设置完毕。
希望这对(某人!)有帮助
关于csv - 快速矿工: CSV with real numbers with commas instead of dots,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5889179/