Javascript Unicode 转换和搜索

我想知道是否有人对将字符代码数组转换为 Unicode 字符并使用正则表达式搜索它们有任何见解。

如果你有

var a = [0,1,2,3]

您可以使用循环将它们转换为 unicode 中前四个控制字符的字符串。

但是，如果您想创建正则表达式

"(X)+"

其中 X == 字符代码 3 转换为其 Unicode 等效项，搜索似乎永远不起作用。如果我检查字符串的长度，它是正确的，并且 .* 返回字符串中的所有字符。但是当我必须从字符代码开始时，我在构建正则表达式来搜索字符串时遇到了困难。有什么建议吗？

编辑:

var a = [0,1,2,3,0x111]; str = "";

for(var i = 0; i < a.length; i++) {
    str += String.fromCharCode(a[i]);
}

var r = [0x111]
var reg = ""

reg += "(";
for(var i = 0; i < r.length; i++) {
var hex = r[i].toString(16);
    reg += "\\x" + hex;
}
reg += ")";

var res = str.match(RegExp(reg))[0];

编辑

//Working code:
var a = [0,1,2,3,0x111];
str = "";

for(var i = 0; i < a.length; i++) {
    str += String.fromCharCode(a[i]);
}

var r = [3,0x111]
var reg = ""

reg += "(";
for(var i = 0; i < r.length; i++) {
    var hex = r[i].toString(16);
    reg += ((hex.length > 2) ? "\\u" : "\\x") + ("0000" + hex).slice((hex.length > 2) ? -4 : -2);
}
reg += ")";

var res = str.match(RegExp(reg))[0];

最佳答案

通过更改一些细节，该示例就可以运行。

假设您对一般的可打印 Unicode 字符感兴趣，而不是专门对前四个控制字符感兴趣，则字符串“hello”的测试向量 a 将为:

var a = [104, 101, 108, 108, 111]; // hello

如果您想匹配两个“l”字符:

var r = [108, 108]

构建正则表达式时，字符代码必须为十六进制:

reg += "\\x" + ("0" + r[i].toString(16)).slice(-2);

之后，您应该会看到预期的结果。

关于Javascript Unicode 转换和搜索，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23588207/

Javascript Unicode 转换和搜索

上一篇：javascript - AngularJs ng-repeat数组内部数组顺序子项

下一篇：javascript - jQuery:单击任意位置即可删除类，而不使用 $ ('body' ).on ('click'