我真的很喜欢 R 中的 data.frames,因为您可以在一个数据结构中存储不同类型的数据,并且您有很多不同的方法来修改数据(添加列、合并 data.frames,...),它从数据中提取子集真的很容易,...
是否有任何可用的具有相同功能的 Java 库?我最感兴趣的是以类似矩阵的方式存储不同类型的数据并能够提取数据的子集。
在 Java 中使用二维数组可以提供类似的结构,但是添加一列然后提取前 k 条记录要困难得多。
最佳答案
Tablesaw (https://github.com/jtablesaw/tablesaw) 是 2015 年开始的 Java 数据框,目前正在积极开发中 (2018)。它被设计成在不牺牲易用性的情况下尽可能可扩展。功能包括按行和列过滤、描述性统计、映射/减少函数、交叉表、绘图、机器学习。 Apache 许可证。
在一次查询测试中,它在 2 毫秒内从 1/2 亿记录表中返回了 500 多条记录。
欢迎提供贡献、功能请求和反馈。
关于与 R data.frame 类似的 Java 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20540831/