我必须解析一个基于正则表达式的网站 $x
使用 p
<a href="">(001)</a>
<a href="">(002)</a>
<a href="">(003)</a>
<a href="">(004)</a>
<a href="">Hello1</a>
<a href="">Hello2</a>
<a href="">WOrld</a>
我正在使用下面的代码
const xpathTxtArr = await page.$x("//*/a[contains(text(), 'Hello')]");
使用 hello
获取所有链接文本。同样我想知道,如果我可以传递像
\d{3}
这样的正则表达式在 page.$x
使用模式获取链接处理程序的表达式 (001)
?
最佳答案
好吧,我找不到答案。要 grep 我使用的文本 evaluate
函数来获取所有内部文本。
这是示例代码
const result = await page.evaluate(async () => {
console.log('Browser scope.');
let elementTxtArr = [];
document.querySelectorAll("a").forEach((a)=> {
console.log(a.innerText);
elementTxtArr.push(a.innerText);
});
return elementTxtArr;
});
console.log(result);
关于javascript - 使用 puppeteer 在页面中基于文本的值搜索中使用正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59233115/