hadoop - 保护Hadoop集群

标签 hadoop kerberos openldap

我正在尝试了解安全访问Hadoop集群的最佳方法。

我一直在指以下链接:

  • http://hortonworks.com/hadoop-tutorial/integrating-hadoop-cluster-microsoft-active-directory-authentication/
  • http://hortonworks.com/blog/hadoop-groupmapping-ldap-integration/

  • 我想了解哪种方法更好? kerberized集群的优势是什么?安全的LDAP就足够了吗?

    提前致谢。

    最佳答案

    安全性是Hadoop集群中的重要主题。有几种保护Hadoop集群的方法,但是所有方法最终都取决于存在哪种类型的需求,并且可以根据需求确定安全性方面。

    基于Kerberos的Hadoop身份验证目前正被广泛使用。这是
    通常称为Hadoop安全性。启用Hadoop安全性后,它要求用户进行身份验证(使用Kerberos)才能在HDFS中读取和写入数据或提交和管理MapReduce作业,并且所有Hadoop服务都使用Kerberos彼此进行身份验证。

    尽管Hadoop安全性提供Kerberos身份验证,但它不保护通过网络传输的数据。如果您的Hadoop群集包含敏感信息(财务数据,信用卡交易,医疗保健信息等),则可能需要确保在访问过程中也对数据进行保护。
    通过网络传输(以避免窃听和中间人攻击)。这与您在连接到银行网站时使用安全连接(使用HTTPS)访问银行网站没有什么不同。为了解决这些用例,网络加密已添加到Hadoop,并且可以使用。

    该链接将有助于理解Hadoop群集上的网络加密。

    http://blog.cloudera.com/blog/2013/03/how-to-set-up-a-hadoop-cluster-with-network-encryption/

    关于hadoop - 保护Hadoop集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30243344/

    相关文章:

    python - Kerberos 票证在 LINUX RHEL7 上过期

    java - Java 库路径 Cloudera 中没有 Hadoop。提交 Java 作业时

    java - IBM JDK 将 GSSCredential 转换为主题

    openldap "no global superior knowledge"

    hadoop - 如何通过ambari将群组路由到特定的 yarn 队列?

    java - 加载 Hive 内置函数失败

    java - 我如何以编程方式获取 Hadoop 在 Web 界面中显示的所有作业跟踪器和任务跟踪器信息?

    apache-spark - Spark + 写入 Hive 表 + 解决方法

    authentication - 如何重新启动 alfresco 4 社区中的子系统?

    java - 如何使用UnboundID获取DN和密码