我遇到一种情况,我正在从网页中抓取数据,并且需要将该数据(一堆字符串)存储在 txt 文件中。我已经为许多网站编写了执行此操作的代码,但是我遇到了一个障碍,BeautifulSoup 似乎不起作用。
我希望能够单击逐场比赛按钮,然后从第一局、第二局等中提取文本。有人知道这样做的方法吗,因为文本在原始 HTML 与我所有其他示例的情况一样。
谢谢!
最佳答案
我不认为这就是 BeautifulSoup 的目的。您可以使用Selenium for Python就像从浏览器中一样与页面交互,并模拟点击。然后从html中提取。
关于Python:从网站中提取原始 HTML 之外的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45065307/