Java文件编码检测和转换器(UTF-8、ASCII)

标签 java encoding utf-8 ascii

我有一个简单的txt。文件,我想知道java中是否有一种方法可以做一些事情,例如notepad++对文件编码所做的事情。它可以检测文件的编码(UTF-8、ASCII、UTF-16...),如果我们愿意,它可以将其转换为另一种编码,而不需要转换特殊字符,如“ç”或“€”用奇怪的字符。

谢谢。

最佳答案

Apache Tika有一个 EncodingDetector针对不同上下文的实现。通常,这些实现使用启发式来确定具有一定概率的字符集。 如果您对详细信息感兴趣,可以深入了解source

关于Java文件编码检测和转换器(UTF-8、ASCII),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33432702/

相关文章:

java - 在正则表达式中使用条件

java - 在java中将二维数组转换为List?

java - 如何删除因分割而产生的空字符串?

javascript - 如何在 node.js 中正确进行内容编码?

python - 使用#-*-编码: utf-8 -*- does not remove "Non-ASCII character '\x9 0' in file hello.exe on line 1, but no encoding declared" error

cookies - CGI 应用程序在 cookie 中处理 UTF-8 字符的规则?

html - html 文件中的 UTF-8 字符编码错误

java - 两个给定时间之间的等待时间

Android - å、ä、ö 等字符无法在 WebView 中正确呈现

php - 特定字符是否可以使用 LOAD DATA LOCAL INFILE 停止数据插入?