python - 你知道有哪些 Python MapReduce 就绪的集群库吗?

标签 python mapreduce libraries

你知道有哪些Python MapReduce就绪的集群库吗?

我在 Java 中找到了一些不错的库 ( http://lucene.apache.org/mahout/ ),但我更喜欢使用 python。

https://github.com/klbostee/dumbo/wiki (Python MapReduce API)

编辑--- 我正在寻找已准备好的mapreduce:Canopy、K-means、Means-shift 等。

最佳答案

如果您愿意,您可以将 Python 与 Hadoop 结合使用:

http://www.michael-noll.com/wiki/Writing_An_Hadoop_MapReduce_Program_In_Python

关于python - 你知道有哪些 Python MapReduce 就绪的集群库吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2853752/

相关文章:

python - python pandas 中列的数组范围

python - 如何使用父类中的对象最好地初始化子类的对象?

python - 如何从列 pyspark 中获得第二高的值?

java - MapReduce 程序产生空输出

hadoop - hadoop jar 和 yarn -jar 的区别

Hadoop 独立实例在执行 MR 作业期间退出,日志中出现 ExpiredTokenRemover 错误(在少数作业成功执行后)

javascript - Dart 是否支持使用现有的 JavaScript 库?

python - 我们可以将 XPath 与 BeautifulSoup 一起使用吗?

codeigniter - Codeigniter 1.7.2 的图表库

linker - FFMPEG 链接错误