如何以多字节安全的方式从字符串中删除标点符号、逗号、破折号等字符?
我将处理来自多种不同语言的输入,我想知道是否有什么可以帮助我的
谢谢
最佳答案
您可以使用 unicode 字符类:
- http://www.regular-expressions.info/unicode.html
- http://php.net/manual/en/regexp.reference.unicode.php
要匹配任何非字母符号,您只需使用 \PL+
,即 \p{L}
的否定。要不删除空格,请使用 [^\pL\s]+
之类的字符类。或者真的只是删除标点符号 \pP+
好吧,显然不要忘记正则表达式 /u
修饰符。
关于php - 正则表达式从 UTF8 字符串中删除非字母数字字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8347655/