regex - 有人知道如何在 Notepad++ 中使用正则表达式来查找阿拉伯字符吗?

标签 regex unicode notepad++ arabic

我正在尝试使用 Notepad++ CTRL+F 和正则表达式检测网页 HTML 中的阿拉伯字符。我输入以下内容作为我的搜索词,它返回所有字符。

[\u0600-\u06FF]

我正在使用的随机文本示例块 -
awr4tgagas
بqa4tq4twْq4tw4twtfwd
awfasfrw34جَ4tw4tg
دِيَّة عَرqaw4trawfَبِيَّ

任何想法为什么这个正则表达式不能正确检测阿拉伯字符以及我应该如何处理?我将文档编码为 UTF-8。

谢谢!

最佳答案

发生这种情况是因为 Notepadd++ 正则表达式引擎是 PCRE,它不支持您提供的语法。

要匹配 unicode 代码点,您必须使用 \x{NNNN}所以你的正则表达式变成:

[\x{0600}-\x{06FF}]

关于regex - 有人知道如何在 Notepad++ 中使用正则表达式来查找阿拉伯字符吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18411903/

相关文章:

regex - <HANDLE> 构造的值可以是 "0";在 perltestscript.pl 第 16 行使用 Defined() 进行测试

用于传递 URL 和失败 CIDR 掩码的正则表达式

java - 如何在两组不同的数字之间创建随机值

html - 表情符号 unicode 不会呈现为表情符号

mysql - Notepad++ 使用自动增量更改文本

c++ - 文本编辑器 API。用于实验性 IDE 的 Scintilla。你用别的东西吗?

c# - 使用 Regex.Matches 计算字符串中的特定单词时出错

java - 如何使用正则表达式操作java中的字符串的一部分

unicode - 如何将不受支持的字符加载到 Teradata Unicode 列中?

svn - 通过 Subversion 更新时关闭 Notepad++?