java - 机器学习/数据挖掘/大数据 : Popular language for programming and community support

标签 java python hadoop machine-learning bigdata

我不确定这个问题是否正确,但我要求解决我的疑问。

  • 对于机器学习/数据挖掘,我们需要了解数据,这意味着您需要学习Hadoop,它在Java中有实现> 用于 MapReduce(如果我错了请纠正我)。
  • Hadoop 还提供streaming api 以支持其他语言(如python)
  • 我认识的大多数研究生/研究人员都使用 python 解决 ML 问题
  • 我们经常看到 hadoop 和 Java 组合的招聘信息

我发现 JavaPython(据我观察)是该领域使用最广泛的语言。

  • 我的问题是在这个领域工作的最流行的语言是什么。
  • 决定应该选择哪种语言/框架的因素有哪些
  • 我同时了解 Java 和 Python,但总是感到困惑:
    • 我是否开始使用 Java 编程(因为 hadoop 实现)
    • 我是否开始使用 Python 编程(因为它编写起来更简单快捷)

这是一个非常开放的问题,我相信这些建议可能会对我和有同样疑问的人有所帮助。
提前致谢

最佳答案

不幸的是,在我看来,占统治地位的语言是 MATLAB……不幸的是,因为我既不喜欢也不使用这种语言,所以我更有可能使用 C++/Java 进行编程。但是我周围的数据挖掘人员和机器学习人员倾向于坚持使用 MATLAB...

编辑:我刚刚在 Wikipedia's page on R 中读到一个非常有趣的行:

According to Rexer's Annual Data Miner Survey in 2010, R has become the data mining tool used by more data miners (43%) than any other.

关于java - 机器学习/数据挖掘/大数据 : Popular language for programming and community support,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6429772/

相关文章:

java - 自动打印在 Java 中不起作用

scala - 如何删除以 Apache Spark 中的某个单词开头的多个 hdfs 目录

python - 元组索引、组合切片和索引

hadoop - 安装Hue时未创建sample_07表

hadoop - 使用cloudera hadoop UI自动化sqoop增量

java - JmDNS.create() 是阻塞还是非阻塞

java - 重复条目 : com/google/android/gms/analytics/internal/Command. 类

java - 使用 Web View 清除 1 个以上 Activity 中的 Web 缓存

python - 如何从路径字符串的 DataFrame 列中提取基本路径

python - Matplotlib 在图底部添加签名栏