regex - 从字符串中的链接获取网站标题

标签 regex perl html-parsing

字符串:“这是徽章,https://stackoverflow.com/badges bla bla bla”

如果字符串包含链接(见上文),我想解析该链接的网站标题。

它应该返回:Badges - Stack Overflow。

我该怎么做?

谢谢。

最佳答案

#!/usr/bin/perl -w

require LWP::UserAgent;

my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->env_proxy;

my $response = $ua->get('http://search.cpan.org/');

if ($response->is_success) {
    print $response->title();
}
else {
    die $response->status_line;
}

参见 LWP::UserAgent .干杯:-)

关于regex - 从字符串中的链接获取网站标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5532584/

相关文章:

java - 使用 Java 解析包含转义字符的字符串

database - 在 Perl 模块中部署数据库的好方法?

python - 对 HTML 文件中表的第 1 列和第 3 列中的数据进行匿名化

python - 查找包含给定文本的未知标签

java - 使用系统文件分隔符拆分文件名

regex - 如何在vim中过滤一些多行语句

java - 使用正则表达式从字符串中删除可选编号

perl - 除非明确包含,否则阻止包含 Perl 模块

php - 解析这个 HTML

c# - 从字符串中删除 unicode 代码的最快方法