我正在尝试将 HTML 数字字符引用转换为字符串。 示例:
イス シート 椅子
它们代表的符号(如果这不能正确呈现给您,我们深表歉意): イス シート 椅子
我已尝试以下操作:CGI::unescapeHTML(str)
,但我仍然看到数字字符代码而不是符号。
我尝试将输出写入文件(以防万一它在终端中无法正确呈现)并使用 TextEdit/vim 打开它,但这没有帮助。
最佳答案
您可以使用htmlentities gem 。还需要考虑十六进制表示法(例如 イ
与 イ
或“イ”相同)。当有一个完整且经过测试的库可以为您完成此操作时,没有充分的理由手动执行此操作(并且可能会错过您可能不知道的各种边缘情况和符号)。
关于html - Ruby HTML unicode 到实际字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4982171/