go - 我可以只读取文件的 n 个字节而不创建 n 大小的缓冲区吗？

我正在检测非常大(30+ GB)的文件是否相同。我不想对所有 30 GB 进行哈希处理，而是对第一个兆字节进行哈希处理，然后将 10% 处开始的兆字节哈希到文件中，然后将 20% 处开始的兆字节哈希到文件中，依此类推。检测 1000 万字节是否相同对于我的目的来说已经足够了。

在 Ruby 或 JavaScript 中，当我执行此操作时，我只需创建一个 10 MB 缓冲区，将 1 MB 读入其中，在文件中向前查找，将另外 1 MB 读入缓冲区，向前查找等，然后对缓冲区进行哈希处理。

在 Go 中，我对如何做到这一点有点困惑，因为 Read、ReadFull、ReadAtLeast 等函数似乎都将缓冲区作为参数然后读取直到填满它。因此，我可以分配 11 个单独的缓冲区，用单独的 1 MB block 填充 10 个缓冲区，然后将它们连接到最后一个缓冲区中进行散列……但这似乎非常低效且浪费。我确信我错过了一些东西，但搜索文档只会让我更加困惑。 Go 中这个问题的合适解决方案是什么？我可以简单地要求将 n 个字节读入预先存在的缓冲区吗？

最佳答案

您可以对传递给 Read 或 ReadFull 的 []byte 缓冲区进行 slice 。

“slice ” slice 指向相同的后备数组，因此分配完整的缓冲区，并将其就地 slice :

r.Read(buf[i : i+chunkSize])

或

io.ReadFull(r, buf[i:i+chunkSize])

https://play.golang.org/p/Uj626v-GE6

关于go - 我可以只读取文件的 n 个字节而不创建 n 大小的缓冲区吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45222251/

go - 我可以只读取文件的 n 个字节而不创建 n 大小的缓冲区吗？

上一篇：go - Hugo 如何维护站点范围的数据，例如 .Site.AllPages？

下一篇：go - 如何使用反射将值设置为包含 nil 的指针