python - python字符串比较中不同种类的撇号

标签 python string pandas

我正在尝试使用 python 进行字符串搜索操作,但它不起作用,因为我的文本中有三种不同类型的撇号 images of apostrophes 。我是从word文档中导入数据的。比较文本示例:

Stimmt`s and Stimmt’s or Stimmt's

当比较时它们都返回 false

"’" == "'"

关于如何避免这种情况有什么想法吗?

编辑:

我认为撇号的这种差异是由于utf-8与ascii等不同造成的(我是从word文档中导入数据的)。因此,替换撇号是一种解决方案,但可能还有其他字符可能会导致问题。因此,我正在寻找一种方法来确保使用正确的编码导入文本。

最佳答案

如果在执行其他操作之前替换所有不寻常的撇号形式,则可以避免遇到任何问题:

df = df.replace("`|'", "'", regex=True)

关于python - python字符串比较中不同种类的撇号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59251168/

相关文章:

Python GtkBuilder 无法从 Glade 3.14 导入 Box 小部件

python - 在 groupby 之后在 pandas DataFrame 的列表变量中创建一个列表

python - 更改 Django TimeInput 中的默认时间

Python 字符串格式 : When to use ! s 转换标志

python - 计算字符串列之间的相关性

python - 使用pivot_table时将分类数据与数值数据相结合

python - 将列添加到数据框并预定义重复行

Python 将元组值从 unicode 转换为 str

string - 显示没有毫秒的 CFGregorianDate

python - Pandas:直接从日期时间列返回小时