python - 无法在Python 3中正确读取HTML数据

标签 python html python-requests

我正在尝试在 Python 3 中读取以下页面的 HTML 数据:

http://dl.nlai.ir/UI/25d36bb4-72aa-43c1-af2d-086540db8aea/LRRView.aspx

我正在这样做:

url=str(input('\n Paste URL here: '))    
url2=requests.get(url)
html=url2.text
print(html)

但它返回错误页面的内容。

让我补充一下,您可能会在网络浏览器中遇到相同的错误页面,但为了避免这种情况,首先打开此地址将解决它:

http://dl.nlai.ir/ui/forms/Index.aspx

您对正确读取数据有何建议?,我想获取页面内容以从源页面中提取 base64 编码的字符串。

最佳答案

除非您先访问“http://dl.nlai.ir/ui/forms/Index.aspx ”, 访问“http://dl.nlai.ir/UI/25d36bb4-72aa-43c1-af2d-086540db8aea/LRRView.aspx”会得到错误的html。所以我猜你需要 session 获取 url,就像这样

s = requests.Session()
url1 = 'http://dl.nlai.ir/ui/forms/Index.aspx'
url = 'http://dl.nlai.ir/UI/25d36bb4-72aa-43c1-af2d-086540db8aea/LRRView.aspx'
s.get(url1)
url2 = s.get(url)
html = url2.text
print(html)

关于python - 无法在Python 3中正确读取HTML数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43390001/

相关文章:

python - django - 这条线在这里实现了什么?

python - 如何使用 django-background-tasks 启动后台周期性任务

php - 视频上传 PHP 脚本不工作

python - Django 不接受来自 python-requests.patch() 的数据

Python ArgumentParser 嵌套参数

带有标签元数据的 jquery 自动完成类别

javascript - 使用 Spotify API 将我当前在 Spotify 中收听的歌曲添加到网站?

python - HTTP 状态代码 200 与 202

python - Beautiful Soup CSS 选择器找不到任何东西

python - matplotlib 颜色条交替顶部底部标签