我在解析 HTML 文件时遇到一些困难。
这是我想要提取网站名称的 HTML 文件部分:
<span class="bold1">Name: </span>www.google.com<br />
<span class="bold1">Name: </span>www.facebook.com<br />
<span class="bold1">Name: </span>www.myspace.com<br />
这里是使用 HTML::TreeBuilder
的 Perl 代码片段模块
my @style = $root->look_down('class' => qr/bold1$/);
我们如何在这里提取下一个元素:我想从上面的示例中提取:
- www.google.com
- www.facebook.com
- www.myspace.com
for (@style) { my $title1 = $_->as_HTML; #text print " title" . $title . "\n"; }
谢谢
最佳答案
使用right()
方法。
关于Perl HTML 解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7945049/