我正在尝试使用 python 进行字符串搜索操作,但它不起作用,因为我的文本中有三种不同类型的撇号 。我是从word文档中导入数据的。比较文本示例:
Stimmt`s and Stimmt’s or Stimmt's
当比较时它们都返回 false
"’" == "'"
关于如何避免这种情况有什么想法吗?
编辑:
我认为撇号的这种差异是由于utf-8与ascii等不同造成的(我是从word文档中导入数据的)。因此,替换撇号是一种解决方案,但可能还有其他字符可能会导致问题。因此,我正在寻找一种方法来确保使用正确的编码导入文本。
最佳答案
如果在执行其他操作之前替换所有不寻常的撇号形式,则可以避免遇到任何问题:
df = df.replace("`|'", "'", regex=True)
关于python - python字符串比较中不同种类的撇号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59251168/