php - 正则表达式从 UTF8 字符串中删除非字母数字字符

标签 php regex

如何以多字节安全的方式从字符串中删除标点符号、逗号、破折号等字符?

我将处理来自多种不同语言的输入,我想知道是否有什么可以帮助我的

谢谢

最佳答案

您可以使用 unicode 字符类:

要匹配任何非字母符号,您只需使用 \PL+,即 \p{L} 的否定。要不删除空格,请使用 [^\pL\s]+ 之类的字符类。或者真的只是删除标点符号 \pP+

好吧,显然不要忘记正则表达式 /u 修饰符。

关于php - 正则表达式从 UTF8 字符串中删除非字母数字字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8347655/

相关文章:

php - 如何从 CLI 调试 PHP CLI 脚本

php - 在框架内创建模块系统

php - 从 Google Chart 时间线项目创建链接

javascript - 如何根据 JSON 属性名称替换字符串值

JavaScript(正则表达式): excluding matches from output

javascript - Tampermonkey - 无法使用正则表达式获取数据

PHP数组切片多个数组不起作用

javascript - 脚本在 html 上或保存为 .js 文件时均不起作用

javascript - 正则表达式:使用正则表达式仅允许简单算术

javascript - 如何在 "["这样的匹配中排除 "]"和 "[abc]"?