r - 下载大文件时 httr GET 函数空间不足

标签 r web-scraping rcurl httr

我正在尝试使用 httr 下载 1.1 GB 的文件,但遇到以下错误:

x <- GET( extract.path )
Error in curlPerform(curl = handle$handle, .opts = curl_opts$values) : 
  cannot allocate more space: 1728053248 bytes

我的C盘有400GB可用空间..

RCurl包中,使用getCurlOptionsConstants()时,我看到了maxfilesizemaxfilesize.large选项但我不明白这些是否/如何通过 configset_config 传递给 httr ..或者我是否需要切换到RCurl 为此..即使我确实需要切换,增加最大文件大小会起作用吗?

这是我的 session 信息..

> sessionInfo()
R version 3.0.0 (2013-04-03)
Platform: i386-w64-mingw32/i386 (32-bit)

locale:
[1] LC_COLLATE=English_United States.1252  LC_CTYPE=English_United States.1252    LC_MONETARY=English_United States.1252 LC_NUMERIC=C                           LC_TIME=English_United States.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] XML_3.96-1.1 httr_0.2    

loaded via a namespace (and not attached):
[1] digest_0.6.0   RCurl_1.95-4.1 stringr_0.6.2  tools_3.0.0   

..并且(不推荐这样做,因为这会花费你一段时间)如果你想重现我的错误,你可以转到https://usa.ipums.org/usa-action/samples ,注册一个新帐户,选择2011年5年acs摘录,添加大约一百个变量,然后等待摘录准备好。然后编辑前三行并运行下面的代码。 (再次强调,不推荐)

your.email <- "email@address.com"
your.password <- "password"
extract.path <- "https://usa.ipums.org/usa-action/downloads/extract_files/some_file.csv.gz"

require(httr)

values <- 
    list(
        "login[email]" = your.email , 
        "login[password]" = your.password , 
        "login[is_for_login]" = 1
    )

POST( "https://usa.ipums.org/usa-action/users/validate_login" , body = values )
GET( "https://usa.ipums.org/usa-action/extract_requests/download" , query = values )

# this line breaks
x <- GET( extract.path )

最佳答案

仅供引用 - 这已添加到 httrwrite_disk() 控件中: https://github.com/hadley/httr/blob/master/man/write_disk.Rd

关于r - 下载大文件时 httr GET 函数空间不足,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17306695/

相关文章:

python - 无法将代理和链接传递到线程池以获取结果

r - 异步 POST 请求 - R,使用 RCurl?

asp.net - 如何使用R登录然后从aspx网页下载文件

r - 在 R 中提取以标点符号开头和结尾的文本

python - BeautifulSoup 无法解析内容,因为页面加载速度太慢

r - 如何识别与 R 中的线相交的栅格单元?

xpath - 使用scrapy从元标记中提取关键字

r - 如果 RCurl::getURL() 执行时间太长,如何停止执行?

r - 在水平绘图子图图中共享 x 轴标签

r - 如何在 R 中用数字向量表示多项式