java - 在java中为爬虫设置Accept-Language header

标签 java web-crawler imdb http-accept-language

我想找到正确的方法来为我的抓取工具设置 Accept-Language header ?我阅读了其他相关答案,例如 Getting imdb movie titles in a specific languageHow to set Accept-Language header on request from applet 但它们对我不起作用(我收到此错误:“该方法对于类型连接未定义” 这是部分代码:

String baseUrl = "http://www.imdb.com/search/title?at=0&count=250";

org.jsoup.Connection con = Jsoup.connect(baseUrl).userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21");

请帮助我,我对java真的很陌生。

谢谢

最佳答案

在 JSoup 中,您可以使用 header 方法来设置请求 header 。所以你的代码的最后一行将变成这样。为了便于阅读,我刚刚添加了换行符。

org.jsoup.Connection con = Jsoup
     .connect(baseUrl)
     .userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21")
     .header("Accept-Language", /* Put your language here */);

例如,要接受英语,您可以编写 "en" 来代替最后一条注释。

关于java - 在java中为爬虫设置Accept-Language header ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23836512/

相关文章:

java - 如何让线程等待,直到另一个线程完成该方法执行

java - 将 HTML 资源保存在字节数组中

redis - 写爬虫时如何保持访问过的url和维护作业队列

java - 获取 Spring 嵌入式数据库内容

python - 如何使用 iMDBpy 获取音轨信息?

java - 当我尝试通过套接字流发送/接收 jxrpc 时出现 "socket closed"错误

java - JSch - wait() 在 Channel.sendChannelOpen 调用期间无效

java - 如何在托管的 spring 事务中运行遗留代码?

html - 无法使用scrapy从farfetch抓取数据