javascript - CMS 的动态网络抓取表

标签 javascript python drupal web-scraping html-table

当我无法访问服务器端脚本时,有没有人建议我如何从网站上抓取每天更新的表格?具体来说,我正在使用 CMS - Drupal - 并且无法访问托管服务器,也无法创建或修改模块。我相信这排除了使用 Python、PHP 等的可能性。

有没有什么方法可以仅使用 Javascript 在我的网页上抓取网站的 HTML、解析表格并显示其数据(或完整显示表格)?我读过 Node.js 和其他依赖于 PHP 等语言的脚本,但正如我所说,我不相信我可以运行这些。

任何建议或线索都是最有帮助的。我对这些功能的运行方式不是最了解的。

编辑 --- 我应该提到它具有相同的域。动态更新的内容位于我无法访问的子目录中。我想这听起来有点傻,但这就是我所处的情况。

最佳答案

由于 same origin policy ,您无法从 javascript 访问外部网站。

但是,如果该站点位于同一域中,我想您可以调整对 this question 的回答中提供的代码。 .

关于javascript - CMS 的动态网络抓取表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12720582/

相关文章:

javascript - 如何通过单击按钮更改彩色框的不透明度?

python - 如果元组有一个共同元素,则合并元组

php - Drupal 8 Ajax 忘记表单更改

Python:更改:如何使局部变量成为全局变量?

drupal 链接到 View 依赖于参数

php - 以编程方式在 Drupal 6 中创建带有字段的新内容类型

javascript - 如何从 A-Frame 上的 GLB 3D 对象获取动画剪辑的名称?

php - 在同一页面的多个字段上实现money.js

javascript - 页面加载完成后如何执行 JavaScript 函数?

python - 为什么我不能从子类访问 XGBClassifier feature_importances_?