python - 寻找关于网络抓取项目最佳实践的好教程的推荐?

标签 python ruby screen-scraping beautifulsoup hpricot

<分区>

我需要做一个涉及网络抓取的相当广泛的项目,并且正在考虑使用 Hpricot 或 Beautiful Soup(即 Ruby 或 Python)。有没有人遇到过他们认为在这个主题上特别出色的教程,可以帮助我顺利地开始项目?

最佳答案

我最喜欢的两个 Python 网络抓取工具是 ScrapyMechanize .其中每个项目都有自己的教程和最佳实践。

关于python - 寻找关于网络抓取项目最佳实践的好教程的推荐?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/684629/

相关文章:

JavaScript 以编程方式强制关闭选项卡?

python - 如何从字符串变量中删除值

ruby-on-rails - 使用 rbenv 的 pow 无法加载正确的 ruby​​ 版本

c# - 编写一个扫描电子商务网站并从中提取产品图片+价格+描述的C#程序

ruby - 为什么 f(arg, superfluous_arg) 是 ArgumentError 而 f (arg, superfluous_arg) 是 SyntaxError?

Ruby:从内部 block 产生不起作用

rvest 从表中的指定列中抓取

python - 在数据帧的列上使用 sklearn 的 LabelEncoder

python - 检查电子邮件的加密状态。

python - 从管理页面隐藏 django-allauth 模型