我目前正在使用这个脚本来清理一段文本......
function rseo_sanitize($s) {
$result = preg_replace("/[^a-zA-Z0-9'-]+/", "", html_entity_decode($s, ENT_QUOTES));
return $result;
}
我想添加对特殊字符集合的支持,例如 ñ、á、é、í、ó、ú 等
如何将这些(以及更大的西类牙字符集)整合到 preg_replace 中?
最佳答案
可以使用/\pL+/u
来匹配Unicode中的所有字母符号。
PCRE 中没有专门针对西类牙字母的单独平面,但您可以尝试:
/[^\p{Latin}0-9'-]+/u
这包括我认为来自 ISO Latin-1 字符集的所有内容。这包括其他欧洲语言,而不仅仅是西类牙语。但否则你真的必须单独列出所需的字母。
关于php - 字符串清理以支持特殊字符,例如 ñ、á、é、í、ó、ú 等,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6217881/