java - 大数据用什么数据结构

标签 java algorithm data-structures

我有一个包含一百万行的 Excel 工作表。每行有 100 列。 每行代表一个具有 100 个属性的类的实例,列值是这些属性的值。

什么数据结构最适合在这里使用,以存储数百万个数据实例?

谢谢

最佳答案

这实际上取决于您需要如何访问这些数据以及您想要针对什么进行优化——例如空间与速度。

  • 如果您想针对空间进行优化,那么,您可以只序列化和压缩数据,但如果您需要读取/操作数据,这可能毫无用处。
  • 如果按索引访问,最简单的就是数组的数组。
  • 如果您改为使用一个对象数组,其中每个对象包含您的 100 个属性,您就有了一种更好的方法来构建您的代码(封装!)
  • 如果您需要查询/搜索数据,这实际上取决于查询的类型。您可能想看看 BST 数据结构...

关于java - 大数据用什么数据结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11094645/

相关文章:

java - 如何调用存储在 HashMap 中的方法? ( java )

java - Grails 从 REST Web 服务端点下载 pdf 文件

java - 访问 Oozie 作业中在命令行输入的属性

php - 出现任何错误时停止并返回 Json 响应

python - 在 Python 中实现类似缓冲区的结构

algorithm - 订单统计树中节点的排名

java - 同步不经常更新的 hashmap 的最佳方式

java - 为什么 JPA TypedQuery 抛出异常 : Parameter value [. ..] 与预期类型 [java.lang.Character] 不匹配?

c# - 组合的分组算法

python - 合并两个排序列表时,为什么我会得到两个不同的输出 (Python)