我使用这个 re.match 调用来仅获取“正确的”字符串:
re.match('^[A-Za-z0-9\.\,\:\;\!\?\(\)]', str)
但我也收到了一些垃圾,例如 #
和 _
。这怎么可能?我做错了什么?
谢谢!
最佳答案
使用它来检查所有字符,直到字符串末尾,否则您的模式将仅检查第一个字符:
re.match('^[A-Za-z0-9.,:;!?()]+$', str)
请注意,字符类不包含空格、换行符或制表符。您可以像这样添加它们:
re.match('^[A-Za-z0-9.,:;!?()\s]+$', str)
如果您想允许空字符串,您可以将 +
量词替换为 *
关于Python仅重新匹配字符、数字和一些标点符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18594583/