有谁知道是否有一种简单的方法来检测 Java 中的字符集编码?在我看来,某些程序能够检测给定数据使用的字符集,或者至少可以进行近似。
我想底层机制必须解码每个字符集中的数据,然后选择具有最少未定义字符的那个,然后是哪个字符集更常见以打破平局。
有什么想法吗?
最佳答案
看看jchardet ,一个从 Mozilla 浏览器移植的库,专门“猜测”文档的字符集。
作为替代方案,cpdetector图书馆,有点新,专门检测文档的代码页。
关于java - 如何检测Java中的字符集编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2248723/