我有一个简单的txt。文件,我想知道java中是否有一种方法可以做一些事情,例如notepad++对文件编码所做的事情。它可以检测文件的编码(UTF-8、ASCII、UTF-16...),如果我们愿意,它可以将其转换为另一种编码,而不需要转换特殊字符,如“ç”或“€”用奇怪的字符。
谢谢。
最佳答案
Apache Tika有一个 EncodingDetector针对不同上下文的实现。通常,这些实现使用启发式来确定具有一定概率的字符集。 如果您对详细信息感兴趣,可以深入了解source 。
关于Java文件编码检测和转换器(UTF-8、ASCII),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33432702/