python - scrapy从xml文件读取起始url,该url有 "&"

标签 python xml python-2.7 scrapy

首先让我向您澄清, 我有一个包含 & 的 URL,我想抓取它。

当我从命令行手动抓取它时,它工作得很好,但是当我告诉蜘蛛从 xml 文件中读取起始网址时,我遇到了 xml 文件未定义的问题正确地,我 100% 确定问题是起始网址中的 & ,因为当我使用我的代码读取任何没有 & 登录的网址时它,ti 工作得很好

我尝试将 & 更改为 & 但不起作用

请帮忙

顺便说一句,这是网址 https://itunes.apple.com/ae/genre/ios-social-networking/id6005?mt=8&letter=A

最佳答案

尝试对&符号进行百分比编码:

https://itunes.apple.com/ae/genre/ios-social-networking/id6005?mt=8%26letter=A

或者,作为替代方案,使用 ; 作为分隔符:

https://itunes.apple.com/ae/genre/ios-social-networking/id6005?mt=8;letter=A

关于python - scrapy从xml文件读取起始url,该url有 "&",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28401157/

相关文章:

python - 创建将在指定 python 虚拟环境中运行的 .py 文件,同时还通过指定路径导入其他文件

javascript - Microsoft.XMLDOM js 问题

sql-server - 在 SQL Server XML 数据类型查询中使用命名空间时出现问题

python - opencv python中的椭圆检测

python-2.7 - 这段代码有什么问题? (Python,语法错误)

python-2.7 - graphlab-create 2.1安装无法卸载distutils安装的项目 'certifi'

Python scipy.numpy.convolve 和 scipy.signal.fftconvolve 不同的结果

python - Django和Nginx- docker -添加add worker_connections的问题。 nginx-这里不允许使用伪指令

python - 空用户输入的默认值

Java:在不使用 QName 的情况下读取具有动态添加元素的 xml 文件