我是 Azure 数据湖世界的新手。我正在寻找使用天蓝色数据湖的任何必要的先决条件和注意事项。我找到了一个很好的链接,并且发现安静很有用。 http://www.sqlchick.com/entries/2016/7/31/data-lake-use-cases-and-planning
现在,我不确定的一件事是数据湖中的数据保留策略。有人说数据不应该从数据湖中删除/清除,但很少有人持不同意见。
那么,对于任何数据湖中的数据保留策略(存档、清除),我们是否需要遵循任何具体和基本的注意事项?我知道用例将是这方面的决定因素,但我的问题是,在做出决定之前是否需要进行任何高级考虑。
谢谢
最佳答案
我认为您的主要因素是:
- 是否有使数据过期的法律义务?
- 数据过期是否有成本原因?
- 是否存在过时因素,导致您不再关心旧数据(并且愿意在未来被证明是错误的)?
关于azure-data-lake - 数据湖中的数据保留策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42326465/