linux - 在 LinuxMint 中安装 Hadoop

标签 linux hadoop

我已经在 Udemy 上开始了有关 Hadoop 的类(class)。。现在，讲师使用 Windows 操作系统并安装虚拟机，然后运行 Horton Sandbox 镜像以使用 Hadoop。我正在使用 LinuxMint，在对 Linux 上安装 hadoop 进行一些研究后，我发现 (click for ref)我们可以在 Linux 上安装 VM 并下载 Horton Sandbox 镜像来运行它。

我还发现了另一种不使用VM的方法(click for ref) 。我很困惑安装 hadoop 的最佳方法是什么。
我应该使用VM还是第二种方法？哪个更有利于学习和发展？

非常感谢您的帮助!

最佳答案

can install the VM on linux

您可以在任何主机操作系统上使用虚拟机...这就是虚拟机的意义所在。

最后一个链接仅 Hadoop，其中 Hortonworks 有很多很多类似 Spark、Hive、Hbase、Pig 等。否则您需要自己另外安装和配置

Which is better for learning and development?

我强烈建议总体使用虚拟机(或容器)

1) 而不是试图让 Hadoop 工作而搞乱本地操作系统
2) Hortonworks 文档中有很多教程，这些教程实际上只能在具有预安装数据集的沙箱中运行

关于linux - 在 LinuxMint 中安装 Hadoop，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50247210/

上一篇：python - 重新格式化文本数据从整数转换为时间并使用 sed awk split 与日期连接

下一篇：python - 从linux中的字符串列表中扫描数据

相关文章：

hadoop - to_utc_timestamp 是否考虑夏令时？

linux - 通过 scp(从 Linux)将文件从 Windows 复制到 Linux

linux - 递归地 "normalize"文件名

hadoop - 如何使用Stanford NER CFR训练大型数据集

apache-spark - Hadoop copyToLocalFile 在 Yarn 集群模式下失败

date - 在Hive中执行数据功能，其中日期格式包含需要转义的字符

java - 从原始字节获取 EVDEV 事件代码？

linux - 如何使用 sed 查找替换大于 100 的数字？

linux - 使用 docker FTP 访问存储对象时出现错误 550

sql - Hive:失败:执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码2

©2024 IT工具网联系我们