javascript - 不使用模块从另一个网站抓取数据

标签 javascript node.js web-scraping

我正在尝试使用node.js和wix-code从另一个网站抓取数据。

使用此后端代码

import { fetch } from 'wix-fetch';

export function fetchData() {
let url = 'https://www.brainyquote.com/topics/hacker';

let option = {
    "method": "GET"
}
return fetch(url, option)
.then(result => {
    return result.text();
}).catch(reason => {
    return reason;

 })
}

和客户端代码

fetchData().then(function (result) {
    console.log(result);
})

我可以从这个website得到完整的回复

但我想要的是仅获取引号,然后将它们添加到我的数据库集合中,而不使用像 Cheerio 这样的模块!

最佳答案

如果没有cheerio,你就必须自己解析HTML内容,这会很痛苦。您必须分析 HTML 响应,将响应加载到字符串中,然后使用正则表达式或其他方法解析出您想要的部分。

以下是如何使用正则表达式执行此操作的一些示例:

https://www.javamex.com/tutorials/regular_expressions/example_scraping_html.shtml

关于javascript - 不使用模块从另一个网站抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54605775/

相关文章:

Python xpath解析返回内存定位

python-3.x - os.path.isfile 出现 "file path not defined"错误?

javascript - 条形图元素的 HTML5 JavaScript anchor

node.js - 绑定(bind)到 Electron 中全局变量的更改

node.js - Docker 容器与主机不同步

javascript - 如何使用 puppeteer 访问文本输入字段中的当前值

python - 在支持 POSTing 的情况下呈现不带 Selenium 的 JSON/Javascript 后从网页中抓取 HTML

javascript - 面临 CheckBox 已选中或未选中事件的问题,无法正常工作

javascript - 停止 OpenLayers 2 中的事件?

javascript - 克隆对象时重新绑定(bind)函数的问题