我的系统之前将html编码类型设置为ISO-8859-1,导致所有汉字都以“&\#36830;&\#34915;&\#的格式存储35033;“
。
所以我的问题是,如何将上面的格式转换为UTF-8
的中文单词?
供您引用,我尝试过 utf8_decode、inov,但它们都不起作用。 :(
非常感谢。
最佳答案
该字符串当前的文本编码相当不重要。你所拥有的是 HTML 实体;它们与 ISO-8859 或 UTF-8 等底层“物理”编码无关。您想要的是将这些 HTML 实体解码为特定编码(在本例中为 UTF-8)中字符的字节表示形式。因此:
echo html_entity_decode('连衣裙', ENT_COMPAT, 'UTF-8');
// 连衣裙
关于php - 将中文字符从 ISO-8859-1 转换为 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17961150/