python - 填写并提交 html 表单

标签 python python-2.7

我正在尝试/想要编写一个 Python 脚本 (2.7),它转到网站上的一个表单(名称为 “form1”)并填写该表单中的第一个输入字段包含单词 hello,第二个输入字段包含单词 Ronald,第三个字段包含 ronaldG54@gmail.com

任何人都可以帮我编写代码或给我任何关于如何执行此操作的提示或指示吗?

最佳答案

除了大卫提到的 Mechanize 和 Selenium 之外,它也可以通过 Requests 实现和 BeautifulSoup .

为了更清楚,使用 Requests 向服务器发送请求并从服务器检索响应,并使用 BeautifulSoup 解析响应 html 以了解要发送哪些参数服务器。

这是我编写的示例脚本,它同时使用 RequestsBeautifulSoup 提交用户名和密码以登录维基百科:

import requests
from bs4 import BeautifulSoup as bs


def get_login_token(raw_resp):
    soup = bs(raw_resp.text, 'lxml')
    token = [n['value'] for n in soup.find_all('input')
             if n['name'] == 'wpLoginToken']
    return token[0]

payload = {
    'wpName': 'my_username',
    'wpPassword': 'my_password',
    'wpLoginAttempt': 'Log in',
    #'wpLoginToken': '',
    }

with requests.session() as s:
    resp = s.get('http://en.wikipedia.org/w/index.php?title=Special:UserLogin')
    payload['wpLoginToken'] = get_login_token(resp)

    response_post = s.post('http://en.wikipedia.org/w/index.php?title=Special:UserLogin&action=submitlogin&type=login',
                           data=payload)
    response = s.get('http://en.wikipedia.org/wiki/Special:Watchlist')

更新:

对于您的具体情况,这里是工作代码:

import requests
from bs4 import BeautifulSoup as bs


def get_session_id(raw_resp):
    soup = bs(raw_resp.text, 'lxml')
    token = soup.find_all('input', {'name':'survey_session_id'})[0]['value']
    return token

payload = {
    'f213054909': 'o213118718',  # 21st checkbox
    'f213054910': 'Ronald',  # first input-field
    'f213054911': 'ronaldG54@gmail.com',
    }

url = r'https://app.e2ma.net/app2/survey/39047/213008231/f2e46b57c8/?v=a'

with requests.session() as s:
    resp = s.get(url)
    payload['survey_session_id'] = get_session_id(resp)
    response_post = s.post(url, data=payload)
    print response_post.text

关于python - 填写并提交 html 表单,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12756443/

相关文章:

python - 属性错误 : 'scoped_session' object has no attribute 'session'

python-2.7 - 类型错误:zip 参数 #1 必须支持迭代

python - 计算 python 列表的平均值,不包括文字

python - Web 通知推送在 Chrome 上从 python 抛出 400

python - 通过另一个函数调用函数时双输出

python - 字节从 py2 到 py3 的行为变化

python - 枚举在 Python 2.7 中不可迭代

python - PyPI 模块不工作

python - 如何在 iPython 中使用 deepreload 进行自动重载

Python 共享内存数组,没有属性 get_obj()