在正则表达式中匹配非 ASCII 字符的最简单方法是什么?我想单独匹配输入字符串中的所有单词,但语言可能不是英语,所以我需要匹配诸如 ü、ö、ß 和 ñ 之类的东西。此外,这是在 Javascript/jQuery 中,因此任何解决方案都需要适用于此。
最佳答案
应该这样做:
[^\x00-\x7F]+
它匹配 ASCII character set 中不包含的任何字符(0-127,即 0x0 到 0x7F)。
你可以用 Unicode 做同样的事情:
[^\u0000-\u007F]+
对于 unicode,您可以查看以下 2 个资源:
- Code charts Unicode 范围列表
- This tool创建一个按 Unicode block 过滤的正则表达式。
关于javascript - 正则表达式匹配非ASCII字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/150033/