pyspark - 如何将 Tableau/BI 工具连接到 Delta Lake? (没有数据 block )

标签 pyspark hive tableau-api delta-lake

我正在尝试将数据仓库迁移到 Delta lake。我正在努力弄清楚的一件事是如何在 spark session 之外连接到 Delta Lake(白银和黄金)表。我希望能够使用 Tableau 等 BI 工具连接到这些表。我没有使用数据 block ,我想知道将这些表存储在配置单元元存储中是否有帮助。如果不是这样,那么有人可以用替代方法帮助我,或者这是否可行。

最佳答案

例如,您可以使用 Spark 开源和 delta.io 开源的 Hive 元存储和 Thrift 服务器,然后连接 Tableau 桌面。

关于pyspark - 如何将 Tableau/BI 工具连接到 Delta Lake? (没有数据 block ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66937704/

相关文章:

python - Pyspark - 如何检查两条记录中哪一条具有最新日期及其列值?

jsp - 使用Hbase REST或Hive查询在JSP上显示数据?

python - Spark Structured Streaming - 新批处理上的空字典

python-3.x - 在 jupyter notebook 中将自定义 jars 添加到 pyspark

hadoop - 使用sqoop在HDFS中显示导入的表

azure - 如何在 Microsoft Azure IoT 中创建流数据的自定义仪表板?

python - 使用 Python 刷新 Tableau 仪表板

excel - 如何在 Tableau 中绘制开头为 0 数字的邮政编码的 map ?

python - 在基于 Spark Dataframe 的 API 中过滤多列

apache-spark - dynamic.partition=True 和dynamic.partition.mode = nonstrict 有什么区别?