我正在尝试从网站读取数据。我可以看到我需要的值,但该值没有出现在下载的 html 代码中(使用 urllib2)。该值由一些 js 文件创建,并作为该 ID 的 innerhtml 嵌入到网页中。 PS:那怎么提取呢?与浏览器不同,原始源代码无法呈现 js!
最佳答案
获取数据的另一种方法是让浏览器使用 Selenium 执行所有操作并读取呈现的 html。有点慢,但肯定有效。
您可以在此处找到将 Selenium 与 Python 结合使用的入门指南: http://jimmyg.org/blog/2009/getting-started-with-selenium-and-python.html
关于javascript - BeautifulSoup 获取 innerhtml 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3201824/