使用 Requests 的 Python HTTP 请求二进制数据

标签 python http curl python-requests url-parameters

以下代码仅适用于 curl。如果你能告诉我为什么它不能使用请求在 Python 中工作,那就太好了

curl 'http://cdcnepal.com/Modules/HOmeMoviesLists/WebService2.asmx/GetShowsByDate' \
 -H 'Content-Type: application/json; charset=UTF-8' \
 -d '{"portalId":"1","showDate":"26/05/2014","flag":0,"size":9}'

但是在 Python 中使用以下代码

import requests
import json
url = """http://cdcnepal.com/Modules/HOmeMoviesLists/WebService2.asmx/GetShowsByDate"""
headers = {"content-type":["application/json", "charset=UTF-8"]}
payload = {"portalId":"1","showDate":"26/05/2014","flag":0,"size":9}
r = requests.get(url, headers=headers, data=payload)
print r.text

最初 curl 请求有其他内容,如下所示,但我意识到我可以删除几个。我不确定这是导致错误的原因,因为 curl 请求正在运行。我没有从这两个代码中得到相同的响应。

这可能会有用。从 Chrome 开发工具中提取的 Curl 请求

curl 'http://cdcnepal.com/Modules/HOmeMoviesLists/WebService2.asmx/GetShowsByDate'
 -H 'Cookie: OriginalReferrer=https://www.google.com/;
     OriginalURL=http://cdcnepal.com/;
     ASP.NET_SessionId=i5lbnql5hpp0wm1ywyqbywtj;
     VisitCount=4' 
 -H 'Origin: http://cdcnepal.com' 
 -H 'Accept-Encoding: gzip,deflate,sdch' 
 -H 'Accept-Language: en-US,en;q=0.8,hi;q=0.6' 
 -H 'User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3)
     AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36' 
 -H 'Content-Type: application/json; charset=UTF-8' 
 -H 'Accept: application/json, text/javascript, */*; q=0.01' 
 -H 'Referer:http://cdcnepal.com/Home.aspx' 
 -H 'X-Requested-With: XMLHttpRequest' -H 'Connection: keep-alive' 
 -H 'DNT: 1' 
 --data-binary '{"portalId":"1","showDate":"27/05/2014","flag":0,"size":9}' --compressed

最佳答案

curl -d 开关发送一个 POST 请求,但您正在使用 请求。 get() 而是发送一个 GET 请求(其正文被忽略)。

使用 request.post() 将其改为 POST:

import requests
import json

url = "http://cdcnepal.com/Modules/HOmeMoviesLists/WebService2.asmx/GetShowsByDate"
headers = {"content-type": "application/json; charset=UTF-8"}
payload = {"portalId":"1","showDate":"26/05/2014","flag":0,"size":9}
r = requests.post(url, headers=headers, data=json.dumps(payload))
print r.text

您还需要:

  1. 不为 content-type header 使用列表,不支持单独指定参数。
  2. 将您的 JSON 数据编码为 JSON 字符串; requests 不会为您执行此操作。相反,传递给 data 的字典被编码为 application/x-www-form-urlencoded 数据。

您可以使用 http://httpbin.org/post 更轻松地比较 curl 命令与 requests :

$ curl http://httpbin.org/post \
>  -H 'Content-Type: application/json; charset=UTF-8' \
>  -d '{"portalId":"1","showDate":"26/05/2014","flag":0,"size":9}'

{
  "args": {},
  "data": "{\"portalId\":\"1\",\"showDate\":\"26/05/2014\",\"flag\":0,\"size\":9}",
  "files": {},
  "form": {},
  "headers": {
    "Accept": "*/*",
    "Connection": "close",
    "Content-Length": "58",
    "Content-Type": "application/json; charset=UTF-8",
    "Host": "httpbin.org",
    "User-Agent": "curl/7.30.0",
    "X-Request-Id": "78d7bb7d-e29b-482b-908a-48d2395a050f"
  },
  "json": {
    "flag": 0,
    "portalId": "1",
    "showDate": "26/05/2014",
    "size": 9
  },
  "origin": "84.92.98.170",
  "url": "http://httpbin.org/post"
}

>>> import requests
>>> import json
>>> from pprint import pprint
>>> url = 'http://httpbin.org/post'
>>> headers = {"content-type":"application/json; charset=UTF-8"}
>>> payload = {"portalId":"1","showDate":"26/05/2014","flag":0,"size":9}
>>> r = requests.post(url, headers=headers, data=json.dumps(payload))
>>> pprint(r.json())
{u'args': {},
 u'data': u'{"portalId": "1", "flag": 0, "size": 9, "showDate": "26/05/2014"}',
 u'files': {},
 u'form': {},
 u'headers': {u'Accept': u'*/*',
              u'Accept-Encoding': u'gzip, deflate, compress',
              u'Connection': u'close',
              u'Content-Length': u'65',
              u'Content-Type': u'application/json; charset=UTF-8',
              u'Host': u'httpbin.org',
              u'User-Agent': u'python-requests/2.2.1 CPython/2.7.6 Darwin/13.1.0',
              u'X-Request-Id': u'06d6b542-c279-4898-8701-2c0d502aa36e'},
 u'json': {u'flag': 0,
           u'portalId': u'1',
           u'showDate': u'26/05/2014',
           u'size': 9},
 u'origin': u'84.92.98.170',
 u'url': u'http://httpbin.org/post'}

两种情况都显示返回相同的 json 字典。

如果您使用的是requests 2.4.2 或更新版本,您也可以将JSON 编码留给库;如果您传入要作为 json 关键字参数发送的数据,它也会设置正确的 Content-Type header :

import requests

url = "http://cdcnepal.com/Modules/HOmeMoviesLists/WebService2.asmx/GetShowsByDate"
payload = {"portalId":"1","showDate":"26/05/2014","flag":0,"size":9}
r = requests.post(url, json=payload)
print r.text

关于使用 Requests 的 Python HTTP 请求二进制数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23873604/

相关文章:

c# - 如何使用 AJAX 通过 token key 获取 ASP.NET WebAPI 服务器中的数据库数据

java - KIE Workbench 集成响应 401

mysql - wget解析并插入mysql

python - Qt状态栏颜色

python - 安装 PyQt5 时出现 FileNotFoundError

linux - 用于监听 HTTP 请求和记录请求数据的简单 *nix 工具

linux - 每 5 分钟将 curl 输出重定向到动态文件名

python属性和继承

python - 在控制台而不是 Web 浏览器上显示 Django 错误

PHP 程序因大量数据而失败