php - Perl 与 PHP 的网络抓取

标签 php python perl performance web-scraping

<分区>

假设我们有一个项目需要网络抓取。 (解析字符串(< 40)和抓取网页(获取元数据等) 我知道 perl 有非常适合这项工作的 cpan 模块,所以我可以采用这种方式,而不会那么打扰自己。但我对速度和内存相关的东西一无所知。

那么,你会选择哪个呢? (可能是 Python??)就速度而言,哪个更适合这项工作?请解释...

提前致谢。

最佳答案

使用 Perl 或 Python。两者都有大量用于网络抓取的库。

在 Python 中你可以使用 BeautifulSoup甚至解析许多页面喜欢使用的糟糕的 HTML。

关于php - Perl 与 PHP 的网络抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5538386/

相关文章:

perl - 在 Mojolicious 中,我如何显示我的 session 数据?

Python readline() 在尝试读取大型(~ 13GB)csv 文件时失败

python - NOT NULL 约束失败

python - 在没有\的情况下在Python中分割一条长线

linux - 从标准输出和管道中提取参数

javascript - php日期格式转moment js格式

php - 是否可以配置 Eclipse 以防止某些警告出现在“问题” View Pane 中?

PHP限制文本为两行并在末尾添加点

php - 如何使用 PHP 将关联数组放入 csv 中?

perl - 在 Perl 脚本中使用来自 YAML 配置文件的数据的简单示例