hadoop - Hadoop表源详细信息

标签 hadoop hive hiveql oozie hue

我有一个hadoop表,我需要找到该表的源类型(关系/平面文件/大型机)。我可以访问色相,表格日志。我可以知道如何提取这些细节吗?

最佳答案

您无法从配置单元表中找到数据源。 Hive / Impala表仅保存有关数据的信息和元数据。它不知道它来自哪里。例如如果要使用Sqoop从大型机系统加载数据,则可以将数据加载到avro, Parquet ,压缩,定界等的hadoop系统中,或加载到配置单元表中。
如果您真的想了解数据的血统,则需要寻找像Cloudera Navigator这样的企业解决方案。对于该论坛,该主题的讨论范围太广。
Cloudera Navigator沿袭URL:https://docs.cloudera.com/documentation/enterprise/5-3-x/topics/cn_iu_lineage.html

关于hadoop - Hadoop表源详细信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62629527/

相关文章:

mysql - 如何使用 unix_timestamp( ) 函数对字符串值进行日期比较

bash - 如何确定 Hive 数据库大小?

hadoop - Hadoop Hive-创建自定义Hive输入和输出格式的最佳用例?

hadoop - pig 错误 2118 : Input path does not exist

hadoop - 在 Hive 中授予权限

java - 已弃用的用于实现通用 UDAF 的接口(interface)

hadoop - 更改包含数据的 Hive 外部表中的列名

python-3.x - 示例 Pyspark 程序返回 [WinError 2] 系统找不到文件

c# - 从不同版本的HIVE获得的TFetchResultsResp结果之间的冲突

hadoop - 在hive中的所有数据库中搜索一个表