java - 如何开始学习大数据?作为开发人员,我需要专注于哪些模块

标签 java python hadoop bigdata

关闭。这个问题需要更多 focused .它目前不接受答案。












想改进这个问题?更新问题,使其仅关注一个问题 editing this post .

2年前关闭。




Improve this question




我打算学习大数据。我刚刚浏览了教程,但我有点困惑,从开发人员的角度来看,我需要专注于哪些模块。目前我正在研究java。我希望您的回复对我的大数据之旅的下一步有所帮助。

最佳答案

首先我建议get familiar with the term ,大数据有点蓬松和争论不休,更像是营销口号而不是技术规范,涵盖了广泛的技术。

从那开始,我会尝试确定哪个方面(物联网、构建/运行数据中心、etl/数据集成/仓储、分析/统计/机器学习……)或者可能是哪个应用领域(零售、生物信息学……)你感兴趣,并且从就业的角度来看是合理的。我还会考虑您想要使用的技术堆栈(Scala、Python ...)。

逆向工程工作机会可能是实际获取该信息的一种方式。

Data Scientist个人资料(etl + 机器学习 + 可视化)获得了广泛的认可,并包含某些技能,也可以找到大数据分析师和投标数据工程师,可以说他们的个人资料没有那么明确。

如今,人们可以在数据科学领域获得完整的 MSC(这里是 a personal evaluation),但也许您也可以踏上一条不太花哨的路线。培训可能有不同的质量,我发现 Andy Ngs machine learningdeep learing (大型神经网络)MOOC 令人惊叹,所有来自 EPFL-Scala 方面的东西(如果你想走那条路)在技术上都是一流的,而且从演示文稿来看还不错(我试过 Big Data Analysis with Scala and Spark)。

关于java - 如何开始学习大数据?作为开发人员,我需要专注于哪些模块,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58314908/

相关文章:

java - 在 Android 中建立 FTP 连接

java - JLS如何对应Sun javac/为什么不匹配

python , Pandas : Return only those rows which have missing values

hadoop - mapreduce作业中的应用程序主控数量?并在YARN中mapreduce处理步骤

hadoop - Hadoop术语映射到硬件

java - 使用 Gson 解析 MongoDB 中的日期

java - 为什么找不到getInputStream?

python - Opencv-Python调整大小图像

Python段错误,使用pyqt4

hadoop - HDFS伪分布式模式namenodes启动报错