在我的 CGI 库中,我使用转换器将 IANA 注册的字符集转换为 native 宽 unicode(UTF-16/32,取决于平台)。对于 ICU,所有集和别名都列在 http://www.iana.org/assignments/character-sets 中吗?允许输入到 ucnv_open
还是需要手动交叉引用映射,就像 iconv 一样,我基本上将每个别名映射到相应的 iconv 编码名称?尽管 iconv 既好又简单,但它需要使用一个表来将首选 MIME 类型和别名映射到 iconv 的内置类型(包括将 ISO-8859-x[EI]* bidi 映射到它们的“标准”ISO-8859形式)?
或者有没有办法强制所有表单输入为 ISO-8859-x/UTF-8 以简化所需的转换工作量?
- 参见 rfc 1556
最佳答案
RTFMing HTML 规范,accept-charset="..."
完成工作,因此这是无用的开销。
关于使用 icu 或 iconv 进行字符集转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8198860/