r - 我可以在 R 中执行广义迭代缩放吗？

标签 r data-mining text-mining

我希望将我们自己开发的各种机器学习算法平台从 C# 移植到更强大的数据挖掘平台，例如 R。虽然很明显 R 在许多类型的数据挖掘任务中都很出色，但我不清楚是否它可以用于文本分类。

具体来说，我们从文本中提取一个二元组列表，然后将其分类为 15 个不同类别之一，例如:

Bigram list :珠宝、书籍、 watch 、鞋子、百货商店
-> 类别:购物

我们既想在 R 中训练模型，又想连接到数据库以更大规模地执行此操作。

可以在R中完成吗？

最佳答案

嗯，我开始研究机器学习，但我可能有一个建议:你考虑过Weka吗？ ?周围有很多不同的算法，并且有一些文档。另外，还有一个 R 包 RWeka这利用了 Weka jar 。

编辑:
Witten 等人也有一篇不错的综合读物。 : Data mining其中包含对 Weka 的广泛描述以及其他有趣的内容。研究 API 机会。

关于r - 我可以在 R 中执行广义迭代缩放吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7975181/

上一篇：FCGI 和 PSGI 之间的 Perl 基准测试

下一篇：apache - SVN Hook 突然停止工作

相关文章：

r - data.table roll ="nearest"返回多个结果

python - Pagerank 个性化向量、边缘权重和悬挂字典(隐形传态向量)

python - 使用正则表达式提取不同格式的日期并对它们进行排序 - pandas

r - 如何用正确单词列表替换拼写错误单词列表？

r - 双面移动平均线？

r - 迄今为止转换的秒数

java - 如何使用 K-Means 算法查找异常/离群值

machine-learning - 基于内容的推荐的 Mahout

Python Pandas - 如何格式化和拆分列中的文本？

r - 如何在 R 或 SPSS 中配对网络流量数据行？