ruby - 仅下载文件头

标签 ruby mechanize

我正在使用 mechanize 来抓取一个运行良好的网站,但是因为您无法从链接中判断它链接到的文件类型,例如http://somesite.com/images.php?get=123 是否可以只下载标题?

我问这个问题是因为我想根据文件类型决定是否下载它。 它还可以帮助在下载时决定文件名。

它不必使用 mechanize,但是有没有 Rails 方法可以做到这一点?

最佳答案

这个? http://ruby-doc.org/stdlib/libdoc/net/http/rdoc/classes/Net/HTTP.html#M000682

response = nil
Net::HTTP.start('some.www.server', 80) {|http|
    response = http.head('/index.html')
}
p response['content-type']

关于ruby - 仅下载文件头,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3573270/

相关文章:

python - Mechanize :类型错误: 'NoneType' 对象不支持项目分配

javascript - Mechanize 代表 Selenium/WebDriver 发出发布请求?

python - 使用 python mechanize 登录

ruby-on-rails - 如何模拟重定向到外部 API 的 Controller 的响应?

css - 通过 nokogiri 和 xpath 解析图像

sql - 非常大的 IN (ids) 语句的性能问题

ruby - Rails 4 自定义验证器说明

ruby - 如何使pg gem查询结果符号化?

ruby - 为什么ruby mechanize gem在登录后给出403响应?