我正在尝试从网页中提取一些数据。但是,如果我使用 urllib.request 模块,结果会很困惑,因为数据位于 html 表中(做得也不是很好)。
我发现,如果我在浏览器中打开页面,然后简单地对记事本执行 CTRL+A、CTRL+C、CTRL+V - 我就得到了我想要的结果。有没有办法在 python 中模拟这一点,因为我需要在大量页面上执行此操作。
我也尝试过使用 BeautifulSoup,但正如我所说 - 表格做得非常糟糕,这将归结为修改用于提取每个表格文本的代码,这比实际手动复制粘贴需要更多时间.
最佳答案
还有一些替代方案。
- 仍然使用
urllib
,但自己删除HTML标签或使用Beautiful Soup。 - 如果您熟悉 Qt,请使用
QWebKit
模块加载网页并提取文本。 - selenium驱动程序来控制网络浏览器。
- 如果使用 Windows 并且可移植性不在您的计划中,您可以使用 WinAPI(
SendMessage
或PostMessage
)来模拟 CTRL + < kbd>A、CTRL + C 和 CTRL + V。
希望这有帮助!
关于python - 有没有办法用Python在网页上模拟 "Select all - Copy - Paste"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31321560/