html - 如何解码 HTML 实体?

标签 html perl ascii special-characters

这是一个简单的 Perl 问题:

如何将 ü' 等 HTML 特殊字符转换为普通的 ASCII 文本?

我从这样的事情开始:

s/\&#(\d+);/chr($1)/eg;

并且可以为所有 HTML 字符编写它,但是像这样的函数可能已经存在了?

请注意,我不需要完整的 HTML->Text 转换器。我已经使用 HTML::Parser 解析了 HTML。我只需要用我得到的特殊字符转换文本。

最佳答案

看看HTML::Entities :

use HTML::Entities;

my $html = "Snoopy & Charlie Brown";

print decode_entities($html), "\n";

你可以猜出输出结果。

关于html - 如何解码 HTML 实体?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/576095/

相关文章:

java - 有效/无效的非 ASCII 字符和无效的 ASCII 字符

javascript - 如何将 Controller 的范围属性传递给自定义指令?

javascript - 使用 Web api 并获取引用错误

javascript - Bootstrap 列在 Firefox 中显示不同

perl - 如何在 Perl CGI 中编码以包含 https 而不是 http 的操作

生成 Perl 日期时间?

c++ - 将 WAV 文件音频输入转换为纯 ASCII 字符

c++ - 打印ascii表0-127

html - 将方向更改为垂直表格行 HTML + CSS

regex - 为什么@+ 和@{^CAPTURE} 的长度不同?