我们将数据存储在配置单元文本文件和拼花地板文件中,是否可以将这些数据直接加载到H2O中,还是必须经历诸如csv或pandas数据框之类的中间步骤?
最佳答案
是的,您可以找到所需的所有信息here
H2O当前支持以下文件类型:
笔记:
因此,如果您有从HDFS读取的非常大的数据文件,则最好使用解压缩的csv。但是,如果数据距离LAN较远,则最好使用压缩的csv。
关于hadoop - 我可以直接从配置单元表中提取数据到H2O吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48915519/