我有一个包含数字(int 和 float)的 pandas DataFrame,它会生成所有列的 float 数据类型。至少我是这么认为的。
这些表格是 OCR 扫描到 EXCEL 的结果。在某些情况下,由于扫描错误而出现 ascii 或 word 值。
如何对 DataFrame 中的所有列、所有值执行将总括 str 值设置为默认值 -999999?
我遇到的问题是 pd.replace() 函数似乎是特定于字符串的。
谢谢!
最佳答案
请尝试
df = df.apply(lambda x: pd.to_numeric(x, errors='coerce')).fillna(-999999)
pd.to_numberic 函数会将所有不可解析的字符串转换为“NaN”,并且 fillna 将这些值替换为给定值“-999999”
关于python - 将所有字符串替换为 DataFrame 中的默认数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49933425/