python - Beautiful Soup 将 Unicode 字符转换为 HTML 实体

标签 python python-2.7 unicode encoding beautifulsoup

将文档加载到beautifulsoup后出现此错误
该文档包含诸如 之类的实体,这些实体会转换为 ГÇ£
我想输出 html 实体

最佳答案

使用这个refernce link

 from bs4 import BeautifulSoup
    soup = BeautifulSoup(html_doc)
    print(soup.prettify(formatter="html"))

关于python - Beautiful Soup 将 Unicode 字符转换为 HTML 实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23191624/

相关文章:

python - 如何修改来自扭曲协议(protocol)方法(例如 ConnectionMade)的变量

python - 尝试从elasticsearch-python检查索引模板

python - 将 numpy unicode 数组写入文本文件

iphone - iOS 某些八进制转义序列导致 stringWithUTF8String 为 nil

python - 如何在 python matplotlib 中设置限制范围 (xlim)?

python - 使用python for windows的qrcode生成器

python - 为数组python中的每个元素添加值

django - 无法将对象添加到 Django 的多对多字段

python - 如何使用 python webdriver 在 html 标签之间放置文本

javascript - Fabric js itext支持unicode吗? (韩文未修改)