regex - PCRE 是否正确支持 unicode 字符串?

标签 regex perl unicode pcre

是否PCRE是否正确支持 unicode 字符串?


是的,它确实(虽然可能还不是 Unicode 6)。来自 man page :

The current implementation of PCRE corresponds approximately with Perl 5.12, including port for UTF-8 encoded strings and Unicode general category properties. However, UTF-8 and Unicode support has to be explicitly enabled; it is not the default. The Unicode tables correspond to Unicode release 5.2.0.

关于regex - PCRE 是否正确支持 unicode 字符串?,我们在Stack Overflow上找到一个类似的问题:


regex - 从两个特定字符串之间的任何位置删除特定字符?

带有倒排索引的 Ruby & Mongodb 带来了一些有趣的结果

internet-explorer - 如何在 IE7 中为 IMG ALT 的工具提示正确显示 Unicode 字符?

objective-c - 如何向字符串添加度数符号?

java - "org.apache.commons.lang.StringEscapeUtils"和 "en dash"

javascript - 正则表达式中的高级查找

c# - 在 ASP.NET C# 中使用正则表达式进行 Imgur ID 匹配

Perl CGI 从对当前 URL 的不同请求中获取参数

perl - 如何在 perl 中进行命令替换?

javascript - 从内部更改 iframe