基本上,页面会生成一些动态内容,我想要获取这些动态内容,而不仅仅是静态 html。我无法使用 cURL 来做到这一点。请帮忙。
最佳答案
仅使用 cURL 是不行的。
cURL 将从站点获取特定的原始(静态)文件,但要获取 javascript 生成的内容,您必须将该内容放入支持 javascript 和 javascript 使用的所有其他主机对象的类似浏览器的环境中,以便脚本可以运行。
一旦脚本运行,您就必须访问 DOM 以从中获取您想要的任何内容。
这就是为什么大多数搜索引擎不索引 javascript 生成的内容。这并不容易。
<小时/>如果这是您尝试收集信息的特定网站,您可能需要详细了解该网站本身如何获取数据,并查看是否无法直接从该来源获取数据。例如,数据是嵌入在页面中的 JS 中(在这种情况下,您可以直接解析出该 JS),还是从 ajax 调用中获取的 JS(在这种情况下,您可以直接进行该 ajax 调用)或其他一些方法。
关于php - 如何使用 cURL 从另一个网站获取 javascript 生成的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17076447/