php - 在服务器上用 PHP 解析 HTML 还是在最终用户端用 JavaScript 解析 HTML 会更好?

标签 php javascript web-scraping

我需要编写一个脚本来获取链接并解析链接页面的 HTML 以提取标题和其他一些数据,例如可能是简短的描述,就像您链接到 Facebook 上的内容一样。

当用户向站点添加链接时将调用它,因此在客户端启动站点时可以看到相当数量的点击。

我很好奇我是应该在服务器端使用 PHP 还是在最终用户端使用 Javascript 执行此操作?我一直在编写背后的逻辑,试图找出标记的哪些区域充满了潜在的内容,这让我想知道如果我继续使用 PHP,负载是否会太多。

客户端只有一台像样的网络服务器,我担心解析/分析 HTML 页面可能会产生太多负载,而我们可以用 Javascript 完成,然后将其分配给添加链接的用户。

关于此事的任何建议或想法都会很棒。谢谢。

编辑:此数据不会直接进入数据库,它用于通过自动填写链接的描述来帮助用户,该链接在存储到数据库之前仍经过我的定期审查。

最佳答案

好吧,这很简单,因为由于 same origin policy,从客户端纯粹使用 JavaScript 执行此操作根本不是一种选择。 .

解析 HTML 并不是一项繁重的任务,您应该可以在 PHP 中完成它。

关于php - 在服务器上用 PHP 解析 HTML 还是在最终用户端用 JavaScript 解析 HTML 会更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4433493/

相关文章:

javascript - 在动态创建的元素上附加右键单击事件

python - Scrapy - 使用 xPathSelector 提取嵌套的 'img src'

python - BeautifulSoup 无法从表中抓取值

html - 尝试使用 Python-3.7 抓取 html 的特定部分,但它返回 "None"

php - 如何调用ajax中的函数到php函数并等待响应

javascript - 页面对象中的 For 循环运行不正常

php - 使用 = 和 & 作为分隔符解析字符串,但并非所有 & 都是具有前瞻性的分隔符

javascript - 为什么这些 Eloquent Javascript Chessboard 解决方案之一比另一个更好

php - 如何在 PHP 中从 CSV 文件中排除列标题?

php - 使用 php 和 xpath 在 html 标记后获取文本