python - 删除 pandas 中的中文

标签 python string pandas dataframe replace

我正在尝试从包含拉丁字符和中文字符的 csv 中删除所有中文字符。数据看起来像:

    address                                                 lat
1   农工商超市, Zhangjiang, Pudong New District, 203718       31.204024
2   欧尚, 3057号, Jinke Road, Pudong, 201203, China          31.181804

我需要它看起来像:

    address                                                 lat
1   , Zhangjiang, Pudong New District, 203718               31.204024
2   , 3057, Jinke Road, Pudong, 201203, China               31.181804

我尝试使用 df.replace(/[^\x00-\x7F]/g, "")df.replace(/[\u{0080}-\u {FFFF}]/gu,"") 但出现错误:

    df1.replace([^\x00-\x7F],"");
                 ^
SyntaxError: invalid syntax

需要帮助!谢谢

最佳答案

你快到了:

df['address'] = df['address'].str.replace(r'[^\x00-\x7F]+', '')

结果:

In [99]: df
Out[99]:
                                     address        lat
0  , Zhangjiang, Pudong New District, 203718  31.204024
1  , 3057, Jinke Road, Pudong, 201203, China  31.181804

关于python - 删除 pandas 中的中文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48842639/

相关文章:

python - 创建具有固定值的列

python - python 中的 Xml 具有不平衡/不均匀的元素/标签

python - 如何使用 Django 的 Parse API 解析来自 Sendgrid 的消息?

string - 将括号的子集映射到字符

java - 映射 PostgreSQL text[][] 类型和 Java 类型

python - 如何在 Pandas 数据框中保留前两个副本?

python - 日期值 DataFrame 上的 Pandas Idxmax

python - 3D 中的射线和正方形/矩形相交

python - 主要问题: Dropdown switcher in Mezzanine uses default settings of main site when logged in

python - 如何将日期格式作为参数传递给 Mysqldb 执行方法