目标:我想验证特定的 Google 搜索在右侧是否有建议结果 - 如果有这样的建议 - 抓取一些信息,例如公司类型/地址/等等
方法:我想使用带有 Requests 和 BeautifulSoup4 的 Python scraper
import bs4
import requests
address='https://www.google.co.ve/?gws_rd=cr&ei=DgBqVpWJMoPA-gHy25fACg#q=caracas+arepa'
page = requests.get(address)
soup = bs4.BeautifulSoup(page.content,'html.parser')
print (soup.prettify())
问题:
请求的页面不包含搜索结果(我不确定Google页面上的某些变量是否设置为不可见?),而仅包含Google页面的页眉和页脚
问题:
获取所描述信息的其他方法?有什么想法吗?
一旦我用所描述的方法获得了结果,但各自的地址的构造不同(我记得Google URL中的许多数字,但遗憾的是无法重现搜索地址)。因此:是否需要 Google URL 才能通过 requests.get 进行抓取?
最佳答案
从 Google 地方信息等服务获取信息的最佳方式几乎总是 the official API 。也就是说,如果您执意要抓取数据,则 HTTP 请求返回的内容很可能是供浏览器呈现的。 BeautifulSoup 所做的并不等同于渲染它接收到的数据,因此您很可能只是得到无用的空容器,然后动态填充这些容器。
关于python - 使用 Python 抓取 Google - requests.get 的正确 URL 是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34479656/