python - 如何在 Python 3.1 中对字符串中的 HTML 实体进行转义?

标签 python html curl python-3.x entities

我环顾四周,只找到了适用于 python 2.6 及更早版本的解决方案,没有关于如何在 python 3.X 中执行此操作。 (我只有Win7盒子。)

我必须能够在 3.1 中做到这一点,最好没有外部库。目前,我已经安装了 httplib2 并可以访问命令提示符 curl(这就是我获取页面源代码的方式)。不幸的是,curl 不解码 html 实体,据我所知,我在文档中找不到解码它的命令。

是的,我尝试过让 Beautiful Soup 工作,但在 3.X 中很多次都没有成功。如果您能提供关于如何使其在 MS Windows 环境中的 python 3 中工作的明确说明,我将不胜感激。

所以,为了清楚起见,我需要像这样转换字符串:Suzy & John 变成这样的字符串:“Suzy & John”。

最佳答案

你可以使用函数html.unescape :

Python3.4+ 中(感谢 J.F. Sebastian 的更新):

import html
html.unescape('Suzy & John')
# 'Suzy & John'

html.unescape('"')
# '"'

Python3.3 或更早版本:

import html.parser    
html.parser.HTMLParser().unescape('Suzy & John')

Python2中:

import HTMLParser
HTMLParser.HTMLParser().unescape('Suzy & John')

关于python - 如何在 Python 3.1 中对字符串中的 HTML 实体进行转义?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2360598/

相关文章:

javascript - 响应式 div 中的绝对垂直和水平居中文本

javascript - 为什么我的某些选项卡会导致我的内容稍微向右移动?

javascript - 我的登录导航项在 Bootstrap 中未与右侧对齐

php - curl 错误 : Failed to connect to <url> port 8444: Connection refused, 在本地有效但在服务器中无效

linux curl 重定向和授权

curl 跟随位置错误

python - 带有空变量和 0 维对象数据框的 xarray 和 netCDF 文件

python - Pandas -如果有多个条件则计数

python - 如何有效地设置包含未知数据量的HDF5文件?

python - 将一组 NumPy 数组传递给 C 函数以进行输入和输出