javascript - 阿拉伯语语言的正则表达式

标签 javascript regex

我想编写一个匹配句子中每个单词的正则表达式:

我的正则表达式:“\b(\w+)\b

结果: RegExp matching Arabic image

虽然它与英语单词配合得很好。使用阿拉伯语单词时它不起作用。 我怎样才能对阿拉伯语单词完成同样的壮举?

最佳答案

试试这个:-

function HasArabicCharacters(text)
{
    var arregex = /[\u0600-\u06FF]/;
    alert(arregex.test(text));
} 

列表的阿拉伯字符集

[\u0600-\u06ff]|[\u0750-\u077f]|[\ufb50-\ufc3f]|[\ufe70-\ufefc]

Unicode 中的阿拉伯文字:

Unicode 6.1 开始,阿拉伯文字包含在以下 block 中:

Arabic (0600—06FF, 225 characters)
Arabic Supplement (0750—077F, 48 characters)
Arabic Extended-A (08A0—08FF, 39 characters)
Arabic Presentation Forms-A (FB50—FDFF, 608 characters)
Arabic Presentation Forms-B (FE70—FEFF, 140 characters)
Rumi Numeral Symbols (10E60—10E7F, 31 characters)
Arabic Mathematical Alphabetic Symbols (1EE00—1EEFF, 143 characters)

内容取自维基百科 - Arabic script in Unicode

关于javascript - 阿拉伯语语言的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11323596/

相关文章:

regex - sed 在遇到换行符后停止获取剩余内容

java - 解析多个模式的 InputStream

java - 正则表达式检查字符串是否包含 '1-n' 整数,然后包含 '0-m' 字母

javascript - 正则表达式在循环中的第一个匹配处停止

php - 如何从 php 脚本获取 JSON 中 mysql 表的所有值?

javascript - 如何在 PhpStorm 中重新格式化 JavaScript 文件中的 HTML 代码

javascript - 无法通过 Media Source API 附加片段,得到“InvalidStateError : An attempt was made to use an object that is not, or is no longer, usable

javascript - BigVideo.js Uncaught ReferenceError : _V_ is not defined

r - 当使用 tidyr 分隔符和正则表达式正向前瞻时,有没有办法自动删除分隔符?

javascript - 引用错误 : function is not defined when using onclick