Perl HTML 解析器

标签 perl web-scraping

我在解析 HTML 文件时遇到一些困难。

这是我想要提取网站名称的 HTML 文件部分:

<span class="bold1">Name: </span>www.google.com<br />

<span class="bold1">Name: </span>www.facebook.com<br />

<span class="bold1">Name: </span>www.myspace.com<br />

这里是使用 HTML::TreeBuilder 的 Perl 代码片段模块

my @style = $root->look_down('class' => qr/bold1$/);

我们如何在这里提取下一个元素:我想从上面的示例中提取:

  1. www.google.com
  2. www.facebook.com
  3. www.myspace.com
for (@style) 
{
   my $title1 = $_->as_HTML; #text
   print " title" . $title .  "\n";
}

谢谢

最佳答案

使用right()方法。

关于Perl HTML 解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7945049/

相关文章:

perl - 从类子例程覆盖模块子例程

perl - 如何才能了解Perl最新的面向对象功能?

python - 在 Python 中抓取 - 防止 IP 禁令

python - 使用 Python 进行网页抓取,出现 HTTP 错误 404 : Not Found

python - 抓取网站时回发或回调参数无效

java - 如何从网页中提取文本内容?

python - 计算非常小的值的-log10

linux - 使用perl ssh在远程服务器上写入文件

javascript - Python 网络抓取 - 从哪里开始

mysql - 如何使用 Perl Net::MySQL 更新和删除记录