azure-data-lake - 数据湖中的数据保留策略

标签 azure-data-lake

我是 Azure 数据湖世界的新手。我正在寻找使用天蓝色数据湖的任何必要的先决条件和注意事项。我找到了一个很好的链接,并且发现安静很有用。 http://www.sqlchick.com/entries/2016/7/31/data-lake-use-cases-and-planning

现在,我不确定的一件事是数据湖中的数据保留策略。有人说数据不应该从数据湖中删除/清除,但很少有人持不同意见。

那么,对于任何数据湖中的数据保留策略(存档、清除),我们是否需要遵循任何具体和基本的注意事项?我知道用例将是这方面的决定因素,但我的问题是,在做出决定之前是否需要进行任何高级考虑。

谢谢

最佳答案

我认为您的主要因素是:

  1. 是否有使数据过期的法律义务?
  2. 数据过期是否有成本原因?
  3. 是否存在过时因素,导致您不再关心旧数据(并且愿意在未来被证明是错误的)?

关于azure-data-lake - 数据湖中的数据保留策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42326465/

相关文章:

azure - 以编程方式删除 Data Lake Storage 中的文件

azure - 无法在 Azure 数据工厂的数据集中看到列标题

azure - 如何构建代表 Azure 数据湖(第 2 代)的 Docker 镜像?

azure - 无法将文件从 ADLS 移动到 Snowflake

azure - 如何通过 Azure Data Lake Store gen1 中的新文件触发 Azure Data Factory v2 或 Azure Databricks Notebook 中的管道

c# - 如何处理 U-SQL EXTRACT 语句中丢失的文件?

c# - Azure Datalake 操作返回无效状态代码禁止

azure - 备份Data Lake Store

azure-data-lake - 是否可以从 Azure Data Lake Analytics 中删除已完成的作业?