javascript - 在没有 node.js 的情况下使用 Javascript 库,例如 Cheerio

标签 javascript libraries cheerio

因此,目前我正在开发一个 HTML 页面,该页面显示来自网络的各种内容,我计划使用网络抓取工具获取这些内容。我见过各种各样的爬虫,其中大部分使用 Cheerio 和 Request API/库。然而,所有这些教程(例如:http://www.netinstructions.com/simple-web-scraping-with-node-js-and-javascript/)都使用 Node.js 而不仅仅是 HTML 文件和 .js 文件。我对使用 node.js 没有兴趣,因为这是一个纯粹在本地 PC 上运行的页面(既不托管也不作为网页运行)使用 node.js 似乎只会增加复杂性,因为至少在我的理解中node.js 的作用是允许 javascript 在服务器端而不是客户端执行。所以我的问题是如何将库(例如:https://github.com/cheeriojs/cheerio)下载并导入到我的主要 javascript 文件中,以便它只能通过浏览器运行?

编辑:即使 node.js 不仅仅用于服务器端,我的问题仍然存在。浏览器运行 Javascript,因此如果我将我想使用的库与主 .js 打包并引用它们,那么它可以在没有 node.js 的情况下工作。我只是不知道如何正确地使用具有许多 .js 文件的 cheerio 来做到这一点。 编辑 2:另外,如果有人可以向我指出正确的方向或可以帮助我制作爬虫的教程,如果您不能在客户端使用此类东西,那么它也可能会有所帮助。

最佳答案

您不能在客户端中导入 cheerio,因为它是专门为 nodejs 制作的。但 cherrio 是 jQuery 的服务器端实现(仅在浏览器中运行)。

要导入 jquery,您可以将其作为 html 中的链接。例如:

<script src="https://ajax.googleapis.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>

您应该在导入您自己的 javascript 文件之前放置此文件。

然后在您的 javascript 中,您将可以访问 $,它是主 jQuery 对象的别名。

这是您可以做什么的一个很好的例子:How do I link a JavaScript file to a HTML file?

关于javascript - 在没有 node.js 的情况下使用 Javascript 库,例如 Cheerio,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49019403/

相关文章:

javascript - 一种知道何时在 javascript 中完成所有回调的方法

javascript - 在内容更改时使用 Angular 更新 URL

javascript - 为什么这个 JSON.parse 返回错误 : "unexpected token illegal"?

c - 简单设备驱动程序不工作

java - 初始 SessionFactory 创建失败 : java. lang.NoClassDefFoundError: javax/persistence/EntityListeners

javascript - 如何使用node.js和cheerio抓取谷歌图像

javascript - 世博会: "auth/operation-not-supported-in-this-enviroment"

javascript - 通过将图像附加到列表的元素,其他元素会下降

使用库调试 Google 电子表格脚本

javascript - Web Crawler - 返回要在下一个函数中使用的数组