csv - 快速矿工: CSV with real numbers with commas instead of dots

标签 csv floating-point machine-learning data-mining rapidminer

我在使用 RapidMiner 导入 CSV 文件时遇到问题。 浮点值用逗号代替整数和小数值之间的分隔点。

有人知道如何正确导入以这种方式格式化的值吗?

示例数据:

BMI;1;0;1;1;1;蓝色;-0,138812155;0,520378909;5;0;50;107;0;9;0;其他;良好;2011 BMI;1;0;1;1;1;粉红色;-0,624654696;;8;0;73;120;1;3;0,882638889;其他;好;2011

Rapid miner 实际上将其解释为“多项式”。强制其为“真实”只会导致对“0”值的正确解释。

谢谢

最佳答案

这似乎是一个非常古老的请求。不确定这是否会对您有帮助,但这可能会对其他有类似情况的人有所帮助。

第 1 步:在“读取 CSV”操作符中的“导入配置向导”下,确保选择“分号”作为分隔符

第 2 步:使用“猜测类型”运算符。属性过滤器类型 -> 子集,选择属性 -> 选择属性 8、9 和 16(基于上面的示例),将“小数点字符”更改为“,”,您应该已全部设置完毕。

希望这对(某人!)有帮助

关于csv - 快速矿工: CSV with real numbers with commas instead of dots,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5889179/

相关文章:

python - 如何读取文件夹中的图像并存储其类别号和图像数据? Python

python - 如何在 TensorFlow 中从 MNIST 中排除某个类?

bash - 使用 sed/awk 将变量的内容打印到输出文件中的特定行

Mysql UPDATE JOIN 使用来自 csv 的 LOAD DATA INFILE

python - 如何计算 csv 文件中字符串的最小值?

python - 我将如何编写一个用我的 sqlite3 数据库填充的 CSV 文件?

c++ - 启发式识别一系列 4 字节数据 block 是整数还是 float

floating-point - python 反三角函数(特别是 arcsin)

matlab - matlab中32位十六进制到32位浮点(IEEE 754)的转换

machine-learning - Weka 中与 'confusion matrix' 的混淆