windows - 如何在 Windows 环境下使用 Mahout?

标签 windows cygwin hadoop mahout

我正在尝试在 Windows 上运行的应用程序中使用 Mahout。我想使用 k-means 从 lucene 索引构建集群。

一旦我必须创建序列文件(从 lucene 索引创建向量),我就会得到一个 Hadoop 异常,因为 Hadoop 对 Windows 环境中未知的程序(例如 chmod)进行命令行调用。在 Cygwin 中运行不是一种选择,因为我希望能够从 eclipse 运行该应用程序。

所以我的问题是

  • 有没有办法避免必须创建序列文件才能从 lucene 索引中检索我的向量?
  • 或者有没有办法在 Windows 环境中创建序列文件?
  • 最佳答案

    在 Windows 环境中运行 Hadoop 的唯一方法是安装 Cygwin。有关详细信息,请参阅此博客文章:

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin 将提供 Hadoop 所依赖的所有命令行实用程序(如 chmod)。如果需要,您仍然可以从 Eclipse 中运行 Hadoop 作业。

    关于windows - 如何在 Windows 环境下使用 Mahout?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2735741/

    相关文章:

    .net - 如何在 C++ 中存储 IP 地址?

    shell - Clearcase 多文件重命名

    c cygwin- abored(核心已转储)

    c - 使错误 : Building 64-bit GSL in Cygwin

    hadoop - Hive - 删除尾随零

    hadoop - Cloudera Manager 安装无法从代理接收心跳 - 将新主机添加到集群

    windows - 我可以确定我的单元的初始化顺序吗?

    php - 一段时间后,在 PHP 的 CLI 中打印\r 到 STDOUT 中断

    Java/Scala 远程 HDFS 使用

    windows - 我可以在 Windows 机器中使用的最大 RAM 量是多少?