我正在研究 HIVE。我应该在哪里创建外部表。在我的本地文件系统中还是在 HDFS 文件系统中?推荐用于项目。
最佳答案
它必须位于集群节点可访问的文件系统内。虽然 99% 的情况下这意味着集群文件系统,99% 的情况下这意味着 HDFS,但这并不完全正确:Hadoop 可以访问其他文件系统,简单的例子是 S3FileSystem
或Azure blobs 。
您不能使用外部 Hive 表的地方是本地文件系统。本地文件 URI 对于远程节点来说毫无意义。它可能适用于伪分布式(单节点)“集群”,但不适用于现实世界。
关于Hadoop Hive 外部表位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26815206/