我尝试使用下面的代码来获取网站 htm 源并且它有效。但是访问网站http://reserve.apple.com/WebObjects/ProductReservation.woa/wa/reserveProduct却无法得到结果。通过使用如下代码。但是,我可以通过正确使用浏览器访问此页面。你能给我一些提示或技巧来解决这个问题吗?谢谢。
#!/usr/bin/perl
use strict;
use warnings;
# create a new browser
use WWW::Mechanize;
my $browser = WWW::Mechanize->new();
# tell it to get the main page
my $sURL = 'http://www.apple.com';
#my $sURL = 'http://reserve.apple.com/WebObjects/ProductReservation.woa/wa/reserveProduct';
$browser->get($sURL);
print $browser->content;
exit(0);
最佳答案
这是一种奇怪的行为,但是您要检索的 url 站点需要定义以下 header : 接受、接受编码、接受语言、接受字符集、Cookie。
否则服务器根本不响应。
您只需在“获取”请求之前插入以下代码即可轻松做到这一点:
$browser->add_header(
"Accept" => "",
"Accept-Encoding" => "",
"Accept-Language" => "",
"Accept-Charset" => "",
"Cookie" => ""
);
您可以插入一些实际值而不是空字段,但这也有效。
关于html - 访问网站 - WWW::Mechanize,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8110999/