<分区>
假设我们有一个项目需要网络抓取。 (解析字符串(< 40)和抓取网页(获取元数据等) 我知道 perl 有非常适合这项工作的 cpan 模块,所以我可以采用这种方式,而不会那么打扰自己。但我对速度和内存相关的东西一无所知。
那么,你会选择哪个呢? (可能是 Python??)就速度而言,哪个更适合这项工作?请解释...
提前致谢。
<分区>
假设我们有一个项目需要网络抓取。 (解析字符串(< 40)和抓取网页(获取元数据等) 我知道 perl 有非常适合这项工作的 cpan 模块,所以我可以采用这种方式,而不会那么打扰自己。但我对速度和内存相关的东西一无所知。
那么,你会选择哪个呢? (可能是 Python??)就速度而言,哪个更适合这项工作?请解释...
提前致谢。
最佳答案
使用 Perl 或 Python。两者都有大量用于网络抓取的库。
在 Python 中你可以使用 BeautifulSoup
甚至解析许多页面喜欢使用的糟糕的 HTML。
关于php - Perl 与 PHP 的网络抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5538386/