javascript - BeautifulSoup 获取 innerhtml 数据

标签 javascript python urllib2 beautifulsoup innerhtml

我正在尝试从网站读取数据。我可以看到我需要的值,但该值没有出现在下载的 html 代码中(使用 urllib2)。该值由一些 js 文件创建,并作为该 ID 的 innerhtml 嵌入到网页中。 PS:那怎么提取呢?与浏览器不同,原始源代码无法呈现 js!

最佳答案

获取数据的另一种方法是让浏览器使用 Selenium 执行所有操作并读取呈现的 html。有点慢,但肯定有效。

您可以在此处找到将 Selenium 与 Python 结合使用的入门指南: http://jimmyg.org/blog/2009/getting-started-with-selenium-and-python.html

关于javascript - BeautifulSoup 获取 innerhtml 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3201824/

相关文章:

python - Pandas 数据框无法将列数据类型从对象转换为字符串以进行进一步操作

Python CURL 指定ip地址

javascript - Gulp 无法定位@导入文件 nib.style

javascript - 如何用 Jest 覆盖(或模拟)类方法以测试函数?

javascript - 在 JavaScript 中粘贴事件

python - 是否有像 .to_period 这样的 Python 函数可以帮助我根据日期提取会计年度的周数?

python - 如何反序列化由 to_xml() 在 google appengine 中创建的 xml

python urllib2 无法获取 google url

python - 使用 urllib2 添加 SSL CA 文件

javascript - 如何更改 Fancybox 3 中的控制栏颜色?