perl - 如何使用 Perl 解析 HTML 网站?

标签 perl html-parsing

您能给我一些关于如何在 Perl 中解析 HTML 的建议吗?我计划解析关键字(包括URL链接)并将它们保存到MySQL数据库中。我使用的是 Windows XP。

另外,我是否需要先使用一些离线浏览器工具将一些网站页面下载到本地硬盘?如果我这样做,你能给我推荐一个好的下载工具吗?

最佳答案

您可以使用 LWP 来检索需要解析的页面。有很多方法可以解析 HTML。您可以使用正则表达式来查找链接和关键字(尽管这通常不是一个好的做法),或者像 HTML::TokeParser 或 HTML::TreeBuilder 这样的模块。

关于perl - 如何使用 Perl 解析 HTML 网站?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2748185/

相关文章:

php正则表达式获取href标签内的字符串

perl - 如何将日志记录信息添加到 perl 遗留代码中

iphone - iPhone 上的 libxml2

perl - 如何在 Perl 中检查返回值是否为 1

macos - 苹果操作系统 :/usr/bin/env: bad interpreter: Operation not permitted

javascript - 带有选择器的 Node.js 和 Cheerio 解析表

python - BeautifulSoup 忽略表内的嵌套表

php - 如何输出精确的字符串 "<?php"

python - 如何读取 MIDI 文件、更改其乐器并将其写回?

mysql perl 选择连接和更新表