我有一个网站,我想对其进行正则表达式,比如 http://www.ru.wikipedia.org/wiki/perl .该网站是俄语的,我想提取所有俄语单词。与 \w+
匹配不起作用,与 \p{L}+
匹配会检索所有内容。
我该怎么做?
最佳答案
所有这些答案都过于复杂。用这个
$text =~/\p{cyrillic}/
砰。
关于regex - 如何使用 Perl 匹配 Unicode 文本中的俄语单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/809956/