我正在尝试从多个 Parquet 文件创建临时 View ,但到目前为止还不起作用。作为第一步,我尝试通过从路径读取 Parquet 来创建数据框。我想将所有 Parquet 文件加载到 df 中,但到目前为止,我什至无法加载单个文件,如下面的屏幕截图所示。有人可以帮我从这里出去吗?谢谢 信息:batch_source_path 是第 1 行“path”列中的字符串
最佳答案
您的数据位于 Delta格式,您必须这样阅读:
data = spark.read.load('your_path_here', format='delta')
关于apache-spark - Databricks:检测到不兼容的格式(临时 View ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68351602/