我使用 R 脚本在 HDFS 中添加了一个 CSV 文件。
我用新的 CSV 更新此 CSV/向其追加数据
在此 CSV 上使用 Hive 中的色调创建表。
将其更改为外部表。
现在,如果 hdfs 位置的数据发生变化,hive 表中的数据会自动更新吗?
最佳答案
这就是 Hive 中外部(以及托管)表的问题。它们不是真正的 table 。您可以将它们视为指向 HDFS 位置的链接。因此,每当您查询外部表时,Hive 都会从您创建此表时选择的位置读取所有数据。
来自 Hive 文档:
An EXTERNAL table points to any HDFS location for its storage, rather than being stored in a folder specified by the configuration property hive.metastore.warehouse.dir.
关于hadoop - Hive 中的外部表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37655239/