python - 使用 Python 在低级别执行页面的 JavaScript?

标签 python html web-scraping lxml urllib2

何时 this页面是用 urllib2 抓取的:

url = https://www.geckoboard.com/careers/
response = urllib2.urlopen(url)
content = response.read() 

在源代码 (content) 中找不到以下元素(作业链接)

enter image description here

查看浏览器中呈现的完整源代码:

enter image description here

因此,FRONT-END ENGINEER 元素似乎是由 Javascript 动态加载的。是否可以让 urllib2 (或其他低级库)执行此 Javascript,而不涉及例如Selenium、BeautifulSoup 还是其他?

最佳答案

这些信息是使用一些ajax请求加载的。您可以使用 mozillafirebug 扩展,或者 google chrome 有自己的工具来获取这些详细信息。只需在打开 URL 时在 google chrome 中按 f12 即可。您可以在那里找到完整的详细信息。

在那里您将找到一个带有 url https://app.recruiterbox.com/widget/13587/openings/

的请求

来自上述网址的信息将在该网页中呈现。

关于python - 使用 Python 在低级别执行页面的 JavaScript?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35296860/

相关文章:

Python urllib2 URLError HTTP 状态码。

html - 如何在 robots.txt 中只允许一个代理?

r - 从 stats.nba.com 抓取数据,在 curl::curl_fetch_memory(url, handle = handle) 中获取错误

python - 匹配并删除文件中的字符串

python - 如何使用 UDP 套接字在 python 程序中传输文件

javascript - 每次点击都尝试更改按钮的内容失败

javascript - 现在如何知道在 SHAKA PLAYER 中传递内容保护回调?

python - 我如何抓取这个网站以获取不断变化/正在更新的特定数据?

python - 运行代码时出现 url 错误超过最大重试次数?

Python:如何更改此代码,以便每 60 秒执行一次 doWork()?