python-3.x - Python 3.7,Feedparser 模块无法解析 BBC 天气提要

标签 python-3.x parsing rss rss-reader

当我解析 BBC weather 提供的示例 rss 链接时,它只给出一个空的 feed,示例链接是:“https://weather-broker-cdn.api.bbci.co.uk/en/forecast/rss/3day/2643123

我试过在 python 中使用 feedparser 模块,我想在 python 或 c++ 中执行此操作,但 python 似乎更容易。我还尝试重写不带 https://和 .xml 的 URL,但它仍然不起作用。

import feedparser
d = feedparser.parse('https://weather-broker-cdn.api.bbci.co.uk/en/forecast/rss/3day/2643123')
print(d)

应该给出类似于链接上的 RSS 提要的结果,但它只是得到一个空提要

最佳答案

首先,我知道你没有结果 - 不是像我这样的错误。也许您正在运行不同的版本。正如我提到的,它在 Python 2 的旧版本上产生了结果,使用的程序每晚稳定运行了大约 5 年,但它在 Python 3.7.4 64 上新安装的 feedparser 5.2.1 上抛出异常位。

我不完全确定发生了什么,但是名为 _gen_georss_coords 的函数在第一次调用时抛出 StopIteration。由于 PEP479 的实现,我注意到一些对此错误的引用.它被写成一个生成器,但对于你的 rss 提要,它只需要返回 1 个元组。这是有问题的功能。

def _gen_georss_coords(value, swap=True, dims=2):
    # A generator of (lon, lat) pairs from a string of encoded GeoRSS
    # coordinates. Converts to floats and swaps order.
    latlons = map(float, value.strip().replace(',', ' ').split())
    nxt = latlons.__next__
    while True:
        t = [nxt(), nxt()][::swap and -1 or 1]
        if dims == 3:
            t.append(nxt())
        yield tuple(t)

有一些奇怪的事情正在发生,也许与 PEP479 以及在同一个函数中发生两个独立的生成器这一事实有关,这导致 StopIteration 冒泡到调用函数。不管怎样,我重写了它是一种更直接的方式。

def _gen_georss_coords(value, swap=True, dims=2):
    # A generator of (lon, lat) pairs from a string of encoded GeoRSS
    # coordinates. Converts to floats and swaps order.
    latlons = list(map(float, value.strip().replace(',', ' ').split()))
    for i in range(0, len(latlons), 3):
        t = [latlons[i], latlons[i+1]][::swap and -1 or 1]
        if dims == 3:
            t.append(latlons[i+2])
        yield tuple(t)

你可以在你的代码中定义上面的新函数,然后执行下面的代码将它打补丁到 feedparser 中

saveit, feedparser._gen_georss_coords = (feedparser._gen_georss_coords, _gen_georss_coords)

完成后,您可以将 feedparser 恢复到之前的状态

feedparser._gen_georss_coords, _gen_georss_coords = (saveit, feedparser._gen_georss_coords)

或者如果您确信这是可靠的,您可以修改 feedparser 本身。不管怎样,我做了这个把戏,你的 rss feed 突然开始工作了。也许在您的情况下,它也会带来一些改进。

关于python-3.x - Python 3.7,Feedparser 模块无法解析 BBC 天气提要,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57830019/

相关文章:

python - pycparser 无法解析 gcc 可以处理的一些语法

facebook - 当 Facebook 停止支持 rss feed 时,如何从 Facebook 检索 feed?

java - Spring REST 缓存 RSS AbstractRssFeedView

java - 如何识别网络爬行中的提要?

python-3.x - 无法理解此递归函数的分配和环境用法

python - PyQt显示数据框的tableview垂直标题

python - 从另一个文件获取变量 - python

android - 如果单击通知时 Activity 已打开,则不要打开 Activity

python - 从配置文件中读取 bool 条件?

python - 将非连续值分组到列表中