perl - 我如何从页面中提取所有链接,但不包括使用 Perl 的 WWW::Mechanize 的链接?

标签 perl www-mechanize

我正在尝试使用 WWW::Mechanize使用 find_all_links() 方法从 HTML 页面中提取一些链接。它支持根据这些标准进行匹配:

  • 正文
  • 正则表达式
  • 网址
  • url_正则表达式
  • url_abs
  • url_abs_regex
    ...

我怎样才能提取所有链接有文本“xyz”的链接?

最佳答案

您可以使用 'text_regex' 条件:

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);

参见 perldoc perlre有关否定前瞻断言的更多信息。

关于perl - 我如何从页面中提取所有链接,但不包括使用 Perl 的 WWW::Mechanize 的链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2523074/

相关文章:

Perl:毫秒到日期+时间

perl - 处理 WWW::Mechanize 中的 GET 错误

perl - 如何使用 WWW :Mechanize? 进行分块传输编码上传

perl - 如何使用 Test::WWW::Mechanize 进行授权

python - 用于解析和运行 Javascript 网页的 Javascript 引擎(perl/python)

perl - 你如何覆盖替换操作?

perl - 如何从http响应中获取301/302网站重定向位置并跟随?

perl - 将机械化浏览器传递给子例程(带有 WWW::Mechanized 的 Perl)

perl - 为什么 'chomp' 无法使用 Eclipse 和 Cygwin Perl 在 Windows XP 上删除换行符?

perl - 使用相同的语法按 2 条规则分割线