我正在尝试从包含拉丁字符和中文字符的 csv 中删除所有中文字符。数据看起来像:
address lat
1 农工商超市, Zhangjiang, Pudong New District, 203718 31.204024
2 欧尚, 3057号, Jinke Road, Pudong, 201203, China 31.181804
我需要它看起来像:
address lat
1 , Zhangjiang, Pudong New District, 203718 31.204024
2 , 3057, Jinke Road, Pudong, 201203, China 31.181804
我尝试使用 df.replace(/[^\x00-\x7F]/g, "")
和 df.replace(/[\u{0080}-\u {FFFF}]/gu,"")
但出现错误:
df1.replace([^\x00-\x7F],"");
^
SyntaxError: invalid syntax
需要帮助!谢谢
最佳答案
你快到了:
df['address'] = df['address'].str.replace(r'[^\x00-\x7F]+', '')
结果:
In [99]: df
Out[99]:
address lat
0 , Zhangjiang, Pudong New District, 203718 31.204024
1 , 3057, Jinke Road, Pudong, 201203, China 31.181804
关于python - 删除 pandas 中的中文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48842639/