这是一个简单的 Perl 问题:
如何将 ü
或 '
等 HTML 特殊字符转换为普通的 ASCII 文本?
我从这样的事情开始:
s/\&#(\d+);/chr($1)/eg;
并且可以为所有 HTML 字符编写它,但是像这样的函数可能已经存在了?
请注意,我不需要完整的 HTML->Text 转换器。我已经使用 HTML::Parser
解析了 HTML。我只需要用我得到的特殊字符转换文本。
最佳答案
看看HTML::Entities :
use HTML::Entities;
my $html = "Snoopy & Charlie Brown";
print decode_entities($html), "\n";
你可以猜出输出结果。
关于html - 如何解码 HTML 实体?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/576095/