python - 如何删除使用 Python 中的 Mechanize 生成的链接中的重复项?

标签 python set mechanize duplicate-removal

这是我在 python 中生成链接对象列表的代码。我想从它们中删除重复项。

cb = list()
for link in br.links(url_regex="inquiry-results.jsp"):
        cb.append(link)
print set(cb)

但它返回错误 unhashable instance . link是这样的 -
Link(
    base_url='http://casesearch.courts.state.md.us/inquiry/inquirySearch.jis',
    url='/inquiry/inquiry-results.jsp?action=..........',
    text='12',
    tag='a',
    attrs=[('href', '/inquiry/inquiry-results.jsp?action=.......'),
    ('title', 'Go to page 12')]
    ),

[为方便起见添加了换行符和点]

如何删除重复项?

最佳答案

您可以使用 URL 作为键构建字典并获取其值:

cb = {}
for link in br.links(url_regex="inquiry-results.jsp"):
    cb[link.url] = link
print cb.values()

关于python - 如何删除使用 Python 中的 Mechanize 生成的链接中的重复项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3421737/

相关文章:

python - 在 numba 中删除 numpy.array 中的一行

python - 从阈值掩模生成圆形粒子的分割掩模?

python - 删除每个 y 轴子图的第一个和最后一个刻度标签

haskell - Haskell 中内存高效的虚拟值

python - 在python中,如何使函数接受相同的小写和大写字母?

django - celery , Mechanize 和 socks 代理

python - 从字符串中删除十六进制表示 - Python

algorithm - set union 操作的运行时间

perl - 我如何手动将 cookie 添加到 WWW::Mechanize 已经存在的 cookiejar

python - 使用python在表单中选择动态填充下拉列表