encryption - 使用现有数据在 Redshift 集群上启用加密

标签 encryption amazon-redshift

我负责在具有大量现有数据的 Redshift 集群上启用加密。基于this link我知道启用后，它将创建一个新集群并复制现有数据，从而在此期间以只读方式对其进行访问。我们有许多针对 Redshift 集群运行的 ETL 作业，我正在尝试确定迁移大约需要多长时间。是否可以根据数据大小/节点类型/集群配置进行任何类型的估计？

最佳答案

Is there any kind of estimation available based on data size/node type/cluster config?

基本上，没有。这需要的时间取决于许多因素，其中一些因素超出了您的控制范围，因此很难预测。

您绝对应该首先对此进行测试，以便了解其含义以及可能需要多长时间，例如

通过恢复您的集群的快照来创建一个新的、相同的集群原始簇
按照步骤加密集群并记录所用时间
理想情况下，使用加密集群测试现有 ETL 作业
删除测试集群

根据我调整集群大小的经验(类似但不相同的练习)，由于本地 AWS 资源、网络流量等的变化，我会在测试时间上允许 +/- 10-15% 的裕度。

如果可能的话，我建议终止与集群的所有连接以加快该过程。我们发现一个频繁轮询集群的进程导致调整大小过程花费更长时间。

作为引用点，大约有 20 个节点的 ds 集群。调整 25 Tb 数据的大小大约需要 20 小时。

关于encryption - 使用现有数据在 Redshift 集群上启用加密，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55615777/

上一篇：azureservicebus - 将 Rebus 与 Azure 服务总线、队列和主题结合使用的代码示例

下一篇：batch-file - 通过批处理脚本从 .CSV 中删除行

相关文章：

sql - 按 SQL 中的第一个值对行序列进行分组

amazon-web-services - 在 Amazon Redshift 中延迟执行 SQL 脚本

amazon-redshift - pgAdmin 中的权限被拒绝设置参数

amazon-redshift - 为什么 GROUPBY 和 ORDERBY 的顺序在 Redshift 中很重要？

Java MessageDigest 结果不会保持不变

c++ - 用于保护文本的最强加密是什么？

iphone - iPhone : Core Data or Property Lists? 上什么更容易加密

sql - 亚马逊 Redshift : Best way to compare dates

javascript - 我怎么知道 json 网络 token 是否被篡改

java - 如何手动加密套接字连接的流量？

©2024 IT工具网联系我们