javascript - unescape 在脏话过滤器中不起作用

标签 javascript filter escaping profanity

我正在尝试用 javascript 制作一个脏话过滤器。我成功了,但是当我对坏词进行编码时,我无法得到它

去上类。我已经连续两天在做这件事了。

我尝试对变量中的代码进行转义,然后在匹配时使用该变量。我尝试过在

中进行转义

也匹配代码。我尝试过混合 document.write 和我能想到的其他所有内容。

我原来的功能代码:

var badwords = /fck|psssy|ssshole/i;

Baddata1 = FirstName.value;
Baddata2 = LastName.value;


if (Baddata1.match(badwords))
            {
                checker();
                FirstName.focus();
                return false;
            }
            if (Baddata2.match(badwords))
            {
                checker();
                LastName.focus();
                return false;
            }
function checker() 
        {
            window.alert("Please Remove Bad Words");
        }

最佳答案

您可以通过从 0xffff 中减去字符代码来反转字符串进行编码,然后再反转回来以获得明文。使用“new RegExp”构造:

var encstr = "ン゙ロテム゙フヒニテネミヘロ";   // "bad|nasty|word" put through reverse() function
var badwords = new RegExp(reverse(encstr), "i");
var Baddata1 = "bad";
var Baddata2 = "LastName";

function reverse(str) {
    var sout = "", ix;
    if (!str) {
        return "";
    }
    for (ix = 0;  ix < str.length;  ++ix) {
        sout += String.fromCharCode(0xffff - str.charCodeAt(ix));
    }
    return sout;
}


if (Baddata1.match(badwords))
{
    checker();
    FirstName.focus();
    return false;
}
if (Baddata2.match(badwords))
{
    checker();
    LastName.focus();
    return false;
}
function checker()
{
    window.alert("Please Remove Bad Words");
}

工作中jsfiddle here .

如果您不喜欢使用高字符代码,我可以轻松地替换各种不喜欢使用高字符代码的编码函数,尽管这个是最紧凑的。

编辑:要获取反转的字符串,可以使用 JS 调试器调用反转,或者添加如下临时代码:

console.log(reverse("bad|nasty|word"));

这是有效的,因为reverse(reverse(string1)) === string1。反向操作会自行撤销。

您还可以在单​​独的脚本中保留单词列表,并使用传递给反向的 JS 字符串连接来创建列表,例如:

var wordlist = ["bad", "nasty", "word"];
var joined = wordlist.join("|");
console.log('var encstr = "' + reverse(joined) + '"');

从调试控制台复制字符串并粘贴后,单独的脚本可以轻松检查它是否正确:

var encstr = "ン゙ロテム゙フヒニテネミヘロ";
alert("encstr " + (reverse(encstr) === joined ? "matches" : "does NOT match") + " original");

编辑2:如果您不想使用属于国际范围的高字符代码,只需使用像base64这样的编码,或这个简单的集合:

function encodeStr(str) {
    var sout = "", ix;
    if (!str) {
        return "";
    }
    for (ix = 0;  ix < str.length;  ++ix) {
        if (sout.length)
            sout += ",";
        sout += str.charCodeAt(ix).toString(16);
    }
    return sout;
}

function decodeStr(str) {
    var sout = "", narr, ix;
    if (!str) {
        return "";
    }
    narr = str.split(",");
    for (ix = 0;  ix < narr.length;  ++ix) {
        sout += String.fromCharCode(parseInt(narr[ix], 16));
    }
    return sout;
}

// Using encodeStr on "bad|nasty|word" makes this:
var encstr = "62,61,64,7c,6e,61,73,74,79,7c,77,6f,72,64";
var badwords = new RegExp(decodeStr(encstr), "i");

关于javascript - unescape 在脏话过滤器中不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13347494/

相关文章:

javascript - 如何更改段落文本 onclick 列表项?

javascript - 在fabricjs中加载和存储svg文件

python - 如何使用单个反斜杠转义字符串的特殊字符

javascript - 在 Javascript 中转义两次单引号

haskell - Haskell 中的转义 PCRE 元字符

javascript - 如何使用 JavaScript 使鼠标悬停时图像变大?

javascript - 测量字符串的相同性(在 Javascript 中)

c# - 如何根据多个输入过滤DataView

c - C 低通滤波器

python - 如果我有一个单词列表,如何有效地检查字符串是否不包含列表中的任何单词?