java - 如何检测Java中的字符集编码?

标签 java character-encoding

有谁知道是否有一种简单的方法来检测 Java 中的字符集编码?在我看来,某些程序能够检测给定数据使用的字符集,或者至少可以进行近似。

我想底层机制必须解码每个字符集中的数据,然后选择具有最少未定义字符的那个,然后是哪个字符集更常见以打破平局。

有什么想法吗?

最佳答案

看看jchardet ,一个从 Mozilla 浏览器移植的库,专门“猜测”文档的字符集。

作为替代方案,cpdetector图书馆,有点新,专门检测文档的代码页。

关于java - 如何检测Java中的字符集编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2248723/

相关文章:

java - 有什么方法可以阻止 m2e 修改 eclipse .classpath 文件吗?

java - 需要带有建议和切入点的@Transactional

php - 不正确的字符串编码

PHP HTML 截断和 UTF-8

Java 和 FTP 服务器

java - 在 ConcurrentHashMap#computeIfAbsent 中更新其他键的后果

java - 通过 Android 从 ble 设备发送和接收数据

MySQL加载数据到文件UTF8编码

java - URLEncoder 和 URLDecoder 编解码 Javadoc Note : What if UTF-8 is not used?

mysql - MySQL 中奇怪的分隔十六进制 - 需要转换为 UTF8