我是第一次使用 Node.js 和 Puppeteer,但找不到从 page.evaluate
输出值的方法到外部范围。
我的算法:
- 登录
- 打开网址
- 获取
ul
- 遍历每个
li
然后点击它 - 等待
innetHTML
设置并添加它的src
数组的内容。
如何从 page.evaluate()
返回数据?
const puppeteer = require('puppeteer');
const CREDENTIALS = require(`./env.js`).credentials;
const SELECTORS = require(`./env.js`).selectors;
const URLS = require(`./env.js`).urls;
async function run() {
try {
const urls = [];
const browser = await puppeteer.launch({headless: false});
const page = await browser.newPage();
await page.goto(URLS.login, {waitUntil: 'networkidle0'});
await page.type(SELECTORS.username, CREDENTIALS.username);
await page.type(SELECTORS.password, CREDENTIALS.password);
await page.click(SELECTORS.submit);
await page.waitForNavigation({waitUntil: 'networkidle0'});
await page.goto(URLS.course, {waitUntil: 'networkidle0'});
const nodes = await page.evaluate(selector => {
let elements = document.querySelector(selector).childNodes;
console.log('elements', elements);
return Promise.resolve(elements ? elements : null);
}, SELECTORS.list);
const links = await page.evaluate((urls, nodes, VIDEO) => {
return Array.from(nodes).forEach((node) => {
node.click();
return Promise.resolve(urls.push(document.querySelector(VIDEO).getAttribute('src')));
})
}, urls, nodes, SELECTORS.video);
const output = await links;
} catch (err) {
console.error('err:', err);
}
}
run();
最佳答案
函数page.evaluate()
只能返回一个serializable值,因此无法使用此方法从页面环境返回元素或 NodeList
。
您可以使用 page.$$()
而不是获得 ElementHandle
数组:
const nodes = await page.$$(`${selector} > *`); // selector children
如果常量nodes
的length
是0
,那么确保你正在等待选择器指定的元素被添加使用 page.waitForSelector()
到 DOM :
await page.waitForSelector(selector);
关于javascript - 在 Puppeteer 中从 page.evaluate 获取元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53032903/