python - 将所有字符串替换为 DataFrame 中的默认数字

我有一个包含数字(int 和 float)的 pandas DataFrame，它会生成所有列的 float 数据类型。至少我是这么认为的。

这些表格是 OCR 扫描到 EXCEL 的结果。在某些情况下，由于扫描错误而出现 ascii 或 word 值。

如何对 DataFrame 中的所有列、所有值执行将总括 str 值设置为默认值 -999999？

我遇到的问题是 pd.replace() 函数似乎是特定于字符串的。

谢谢!

最佳答案

请尝试

 df = df.apply(lambda x: pd.to_numeric(x, errors='coerce')).fillna(-999999)

pd.to_numberic 函数会将所有不可解析的字符串转换为“NaN”，并且 fillna 将这些值替换为给定值“-999999”

关于python - 将所有字符串替换为 DataFrame 中的默认数字，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49933425/