scala - 无法将数据 append 到 Parquet [FileAlreadyExists 异常]

标签 scala apache-spark append spark-dataframe parquet

我正在尝试使用以下命令将数据从数据框 append 到现有的 parquet 文件:

dfModified
  .write
  .mode("append")
  .parquet("/home/hduser/s_s_c/fadpd/fadpd.parquet")

但我不断收到这种异常:

Exception in thread "main" org.apache.hadoop.fs.FileAlreadyExistsException: Parent path is not a directory: file:/home/hduser/s_s_c/fadpd/fadpd.parquet

此外,我在开始时将 spark.speculation 设置为 false。 有谁知道我错在哪里?感谢您的帮助和时间!

最佳答案

对于所有试图在 parquet 文件中追加数据的人。您不能 append Parquet 文件。您需要重新创建一个新的,当您查询时,您需要查询所有这些:)

关于scala - 无法将数据 append 到 Parquet [FileAlreadyExists 异常],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39331981/

相关文章:

string - Scala:如何获得字符串的转义表示?

scala - 覆盖Scala枚举值

scala - 从 Scala REPL 执行 shell 命令

android 在 textview _EDIT 末尾追加 '…'

scala - 当我在其他文件夹中构建它的精确副本时,为什么要重新编译原始 scala sbt 项目?

python - PySpark Streaming 示例似乎没有终止

java - 如何在apache spark java中使用hadoop office库将数据集写入excel文件

scala - 删除 GraphX 中没有出边的顶点

java - append 到 utf8 中的文件

jquery - 当最后一行在浏览器中可见时,如何将行追加到表中?