javascript - 处理 javascript 的最简单的网络抓取工具是什么

标签 javascript python

<分区>

我想制作一个能够登录网站的网络抓取应用程序(我能够使用 twill (python) 做到这一点),并且能够执行触发对其他页面的访问的 JavaScript。

我肯定更喜欢在 python 中使用一些东西,但我准备尝试一些新的东西。我已经安装了 mechanize、watir、Hojocki 等,但不确定这是否真的有帮助。

最佳答案

我推荐 PhantomJS .

这是一个完整的 Webkit 浏览器,但 headless 且可编写脚本。

它非常适合这类事情。

关于javascript - 处理 javascript 的最简单的网络抓取工具是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11971959/

相关文章:

python - 如何在 Pandas 表的时间间隔内获取具有 DatetimeIndex 的行?

python - 如何对模型属性进行分组

Python dev_appserver 无法导入 `.so` 文件(枕头)

javascript - jQuery:获取第一行中具有特定类的第一个单元格?

javascript - 需要帮助剖析和重新创建基于 PastryKit 的完美滚动缓动

javascript - div上的 ionic 滑动,如何触发?

python - 将箱线图添加到python中的其他图形

javascript - Android - Webview(kitkat 及以下): Error In Java Script Function 'includes'

javascript - 在 json 中声明动态键(javascript、node)

python - 仅在 python 文件中将制表符扩展到 vim 中的空格?