r - 我可以在 R 中执行广义迭代缩放吗?

标签 r data-mining text-mining

我希望将我们自己开发的各种机器学习算法平台从 C# 移植到更强大的数据挖掘平台,例如 R。虽然很明显 R 在许多类型的数据挖掘任务中都很出色,但我不清楚是否它可以用于文本分类。

具体来说,我们从文本中提取一个二元组列表,然后将其分类为 15 个不同类别之一,例如:

Bigram list :珠宝、书籍、 watch 、鞋子、百货商店
-> 类别:购物

我们既想在 R 中训练模型,又想连接到数据库以更大规模地执行此操作。

可以在R中完成吗?

最佳答案

嗯,我开始研究机器学习,但我可能有一个建议:你考虑过Weka吗? ?周围有很多不同的算法,并且有一些文档。另外,还有一个 R 包 RWeka这利用了 Weka jar 。

编辑:
Witten 等人也有一篇不错的综合读物。 : Data mining其中包含对 Weka 的广泛描述以及其他有趣的内容。研究 API 机会。

关于r - 我可以在 R 中执行广义迭代缩放吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7975181/

相关文章:

r - data.table roll ="nearest"返回多个结果

python - Pagerank 个性化向量、边缘权重和悬挂字典(隐形传态向量)

python - 使用正则表达式提取不同格式的日期并对它们进行排序 - pandas

r - 如何用正确单词列表替换拼写错误单词列表?

r - 双面移动平均线?

r - 迄今为止转换的秒数

java - 如何使用 K-Means 算法查找异常/离群值

machine-learning - 基于内容的推荐的 Mahout

Python Pandas - 如何格式化和拆分列中的文本?

r - 如何在 R 或 SPSS 中配对网络流量数据行?