我正在尝试使用正则表达式从字符串中去除所有不允许的字符。这是我当前的 php 代码
$input = "👮";
$pattern = "[a-zA-Z0-9_ !@#$%^&*();\\\/|<>\"'+\-.,:?=]";
$message = preg_replace($pattern,"",$input);
if (empty($message)) {
echo "The string is empty";
}
else {
echo $message;
}
当我运行它时,当我想要它打印出“字符串为空”时,表情符号被打印出来。
当我将正则表达式代码放入 http://regexr.com/ 时它显示表情符号不匹配,但是当我运行代码时它被打印出来了。有什么建议吗?
最佳答案
这个模式应该可以解决问题:
$filteredString = preg_replace('/([^-\p{L}\x00-\x7F]+)/u', '', $rawString);
有些序列非常罕见,所以让我们解释一下:
\p{L}
匹配来自任何语言的任何类型的字母\x00-\x7F
(索引 0)和(索引 127)之间范围内的单个字符(区分大小写)u
修饰符,用于打开与 Perl 不兼容的 PCRE 附加功能。模式和主题字符串被视为 UTF-8。
关于PHP 正则表达式去除所有表情符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34235995/