file - hadoop中的分布式缓存

标签 file caching hadoop distributed

我们如何在hadoop的分布式缓存中更新文件。
选项:

  • 更新分布式缓存中的文件,然后重新启动mapreduce作业。
  • 用新文件替换文件,并更改指针位置以指向新位置,然后重新启动map reduce作业。
  • 在分布式缓存中追加新值,然后重新启动map reduce作业。
  • 其他选项是.....

  • 我用谷歌搜索,但找不到我的问题的答案,所以在这里发布。
    希望我能得到答案。

    最佳答案

    当mapreduce作业正在运行时,您将无法更新DistributedCache,因为否则这将是关键的竞争。

    您必须重新启动Job,然后只提交另一个DistributedCache数据-作业之间没有持久的DistributedCache。

    关于file - hadoop中的分布式缓存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21924967/

    相关文章:

    c - 与互斥锁同步文件

    java - 无法在 Android 中读取/写入文件

    ruby-on-rails - Rails.root 文件路径通配符

    c - 用 C 实现写回 fifo 缓存

    c# - 由于缓存,Sqlite 第一次查询在 Windows XP 中花费的时间太长?

    hadoop - 如何在HDFS hadoop中释放可用空间?

    azure - HDinsight 配置单元输出到 blob

    hadoop - 执行 pig 脚本时出错?

    java - Apache POI - Docx 输出问题

    java - 如何在 spring mvc 中使用 ehcache 进行永久缓存