我正在尝试将数据仓库迁移到 Delta lake。我正在努力弄清楚的一件事是如何在 spark session 之外连接到 Delta Lake(白银和黄金)表。我希望能够使用 Tableau 等 BI 工具连接到这些表。我没有使用数据 block ,我想知道将这些表存储在配置单元元存储中是否有帮助。如果不是这样,那么有人可以用替代方法帮助我,或者这是否可行。
最佳答案
例如,您可以使用 Spark 开源和 delta.io 开源的 Hive 元存储和 Thrift 服务器,然后连接 Tableau 桌面。
关于pyspark - 如何将 Tableau/BI 工具连接到 Delta Lake? (没有数据 block ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66937704/