php - 越南字符的正则表达式

标签 php regex unicode diacritics

我有一个字符串,想删除以下任何情况下都没有的字符:

  • 不在这个列表中 ưàạảấầẩẫậắằẳẵặẹẻẽềềểễệỉịọỏốồổỗộớờởỡợụủứừễệỉịọỏốồổỗộớờởỡợụủứừửữựỳỵýỷỹửữựỳỵỷỹ

  • 不在 [a-z 0-9 A-Z] 范围内

  • 不是:_ 和空格。

谁能帮我在 php 中使用这个正则表达式?

最佳答案

试试这个正则表达式:

/[^a-z0-9A-Z_ÀÁÂÃÈÉÊÌÍÒÓÔÕÙÚĂĐĨŨƠàáâãèéêìíòóôõùúăđĩũơƯĂẠẢẤẦẨẪẬẮẰẲẴẶẸẺẼỀỀỂưăạảấầẩẫậắằẳẵặẹẻẽềềểỄỆỈỊỌỎỐỒỔỖỘỚỜỞỠỢỤỦỨỪễếệỉịọỏốồổỗộớờởỡợụủứừỬỮỰỲỴÝỶỸửữựỳỵỷỹ]/u

u modifier使 PHP 将模式字符串解释为 UTF-8。

如果这不起作用,请尝试使用 Unicode character properties\p{L} 字母或 escape sequence \x{1234} 用于描述单个 Unicode 字符或自定义字符范围:

/[^a-z0-9A-Z_\x{00C0}-\x{00FF}\x{1EA0}-\x{1EFF}]/u

关于php - 越南字符的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3819791/

相关文章:

php - 可以读取cookie并在mysql SELECT 查询中使用

php - 如何加快 1800 行 PHP 包含的速度?它使我的页面加载速度减慢到 10 秒/ View

c++ - Libtiff 的 TIFFOpenW 抛出异常

PHP:将 curl_exec 输出转换为 UTF8

xml - 竖线 (|) Unicode 替换

javascript - 页面加载 1/5 后恢复正常

php - MySQL时间/日期计算

javascript - 如何仅用属性和特定类替换 img 标签

javascript - 使用正则表达式查找文本文件中段落的开头和结尾

php - LARAVEL 手机以 05 或 06 开头 "preg_match(): No ending delimiter '/' found"