java - 将 Java 字节读取为 CharSet

标签 java character-encoding

特定的CharSet会影响与每个字节关联的二进制(或整数)值吗?

示例:

String original = foo(); // makes string

byte[] utf8Bytes = original.getBytes("UTF8"); // CharSet is UTF8
byte[] defaultBytes = original.getBytes(); // default CharSet 

从二进制/整数值来看,utf8Bytes[1] 是否始终等于 defaultBytes[1]

最佳答案

它会影响值,并且 UTF-8 并不是所有 JVM 上的默认值 - 最好始终使用 getBytes("UTF-8") 来确保编码一致。

例如,使用 getBytes("UTF-8")getBytes("UTF-16") 并比较结果(后者的结果可能是前者的两倍)与前者相同的许多字节)

关于java - 将 Java 字节读取为 CharSet,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16201745/

相关文章:

ruby-on-rails - Ruby 编码问题

java - com.sun.net.httpserver 中的字符编码

java - 无法访问可执行 Jar 中的资源

java - 使用pagemap如何生成随机数

java - 关于效率的一般查询

java - 什么是好的嵌入式 Java LDAP 服务器?

c++ - u'\U0001ABCD' 是否具有实现定义的值或格式错误?

java - 从我的库中隐藏类 (aar)

csv - Google Apps 脚本 txt 文件 getDataAsString() 返回字符之间的 � 和方形符号

python - BeautifulSoup 不给我 Unicode