python - 删除文本中除 "\n"和 "/"之外的所有特殊字符

标签 python nlp

从这篇文章中,我找到了如何从文本中删除除空格和字母数字之外的所有内容:Python: Strip everything but spaces and alphanumeric .

这样:

re.sub(r'([^\s\w]|_)+', '', document)

我基本上想删除所有特殊字符。

但是,现在我想做同样的事情(即删除所有特殊字符),但不删除以下特殊字符:

  1. \n
  2. /

我该怎么做?

最佳答案

我们可以尝试在不使用严格字符类的情况下重写您的模式:

document = "Hello!@#$/ World!"
output = re.sub(r'[^ \nA-Za-z0-9/]+', '', document)
print(output)

Hello/ World

这表示删除任何非字母数字、空格、换行符或正斜杠的字符。

关于python - 删除文本中除 "\n"和 "/"之外的所有特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56279343/

相关文章:

keras pad_sequence 用于字符串数据类型

从单词中组合语法正确的短语的算法

dataset - 带有音节重音信息的英语单词的语料库/数据集?

code-generation - 机器学习和字符串代码生成器

python QLineEdit 文本颜色

python - 如何通过将 Json 对象逐部分发送到 Python 2.7 中的文件来构建 Json 对象?

python - "Pythonic"只要基于前一个元素的条件为真,就可以从可迭代对象中返回元素

python - 如何自动化使用 pyinstaller 和 innosetup 创建的 Django-App_EXE

python - 如何使用 python 将波斯语文本保存在 csv 文件中?

python - 如何在 Python 中使用 selenium 登录网站?