regex - 如何使用 Perl 匹配 Unicode 文本中的俄语单词?

标签 regex perl unicode

我有一个网站,我想对其进行正则表达式,比如 http://www.ru.wikipedia.org/wiki/perl .该网站是俄语的,我想提取所有俄语单词。与 \w+ 匹配不起作用,与 \p{L}+ 匹配会检索所有内容。

我该怎么做?

最佳答案

所有这些答案都过于复杂。用这个

$text =~/\p{cyrillic}/

砰。

关于regex - 如何使用 Perl 匹配 Unicode 文本中的俄语单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/809956/

相关文章:

python - 匹配给定模式后的第二个数字

javascript - 在句子中找到一个定义长度的数字并解析它

Javascript 正则表达式指定允许的内容(而不是不允许的内容)

perl - 为什么 sprintf 以不同的方式舍入 5.555 和 0.555 的小数部分?

perl - 当迭代进入 foreach 循环时打印不起作用

正则表达式排除某些内容并批量重命名文件

windows - 如何在 perl 中为反引号加载 STDIN(不写入临时文件)

security - 如何防范 Unicode 安全漏洞

javascript - 交换 unicode 字符

VS2013 Unicode 中的 C++ 多行 CString 文字