java - 将 ASCII 编码的字节数组转换为字符串会产生奇怪的结果

标签 java sockets

我正在用 Java 创建一个套接字应用程序,它从服务器接收一些 ASCII 格式的 HTML 数据,然后相应地解析这些数据。

byte[] receivedContent = new byte[12500];
receivedSize = inputStream.read(receivedContent);
receivedContent = Arrays.copyOf(receivedContent, receivedSize+1);
if (receivedSize == -1) {
  System.out.println("ERROR! NO DATA RECEIVED");
  System.exit(-1);
}
lastReceived = new String(receivedContent, StandardCharsets.US_ASCII);

这确实应该是非常简单的,但事实并非如此。我打印了一些调试消息,发现尽管收到了一些字节的数据(例如,priting receiveSize 告诉我它收到了 784 字节),这些字节生成的字符串只有几个字符长,如下所示:

Ard</a></li><li><a

我期待一个完整的 HTML 文档,所以这显然是错误的。关于这种情况何时发生也没有明显的模式。这看起来完全是随机的。由于我正在为缓冲区分配新内存,因此其中确实不应该有任何旧数据与套接字中的新数据混淆。有人可以解释一下这种奇怪的行为吗?而且,在运行 OracleJDK 的 Windows 计算机上,而不是在运行 OpenJDK 的远程 Ubunut 计算机上,这种情况发生的频率似乎较低,这可能就是原因吗?我该如何解决这个问题?

更新: 最后我根据 ASCII 表手动检查了字节数组的 ASCII 编码,发现服务器故意发送乱码数据。谜团解开了。

最佳答案

而不是使用:

 inputStream.read(receivedContent);

您需要从流中读取所有数据。使用类似的东西(来自 apache commons io):

 IOUtils.readFully(inputStream, receivedContent)

关于java - 将 ASCII 编码的字节数组转换为字符串会产生奇怪的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52773471/

相关文章:

node.js - 使用 socket.io 中的对象

c# - 如何使用 TcpClient 类在 WCF 中获取超时异常

java - jar 中的类在运行时找不到,但用于编译

Java 比较器 - 函数访问

java - 在JPA中,如何知道entityManager.persist(obj)是否已将对象持久化到数据库中?

c++ - 处理 TCP 故障的正确机制是什么?

java - 如何从 Java 中的字符串中删除\u200B(零长度空白 Unicode 字符)?

java - 如何更新 SQLite 数据库(登录和注册系统)中的密码?

c - C语言向服务器发送HTTP请求后什么也没有收到

java多线程问题(相同的运行时间)