我想扫描网页以查找字典中是否存在关键字。 已经有相关问题被问到,以强调关键词。然而我的字典会很大,例如 50.000 个单词。最好的方法是什么? 我还想在网站上搜索我的图书馆的变体。例如,我的库包含 p53 等基因名称。我想在网站上搜索“p53”、“p53 蛋白”、“p53 的诱导”、“抑制 p53”、“磷酸化 p53”。我怎样才能做到这一点?最快的方法是什么
或者认为我有 2 个列表
List1 List2
------ -------
inhibits p21
induces p53
phosphorylates Akt
decreases Braf
cMyc
我希望它能够搜索 List1 和 2 的组合。
Such as
"inhibits cMyc"
"phoshorylates p21"
这意味着在此示例中需要搜索 4 X 5=20 个关键字。 但最初它会是 200 X 50000 = 1.000.000 个搜索词。
最佳答案
尝试一下也许会对你有帮助
http://www.gotoquiz.com/web-coding/programming/javascript/highlight-words-in-text-with-jquery/
你必须像这样准备你的模式(示例以获得想法)
string keywords = "Cat, rabbit, dog,hound, fox";
Regex r = new Regex(@", ?");
keywords = "(" + r.Replace(keywords, @"|") + ")";
关于javascript - 在网页中搜索数千个关键字的最快方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9406233/