r - 数值分类器(?)Weka/R

标签 r weka numerical classification

我有一个具有“n 到 m”关系的数字数据集(作为数据库表)。例如:

A | B
-----
1 | 1
1 | 2
1 | 9
4 | 2
7 | 8
7 | 11

我想“训练”一个分类器(使用 weka?)来告诉我哪个 A 最有可能成为一组 B。例如:[1,2,8] 应该按照 {1:2, 4:1, 7:1} 的方式告诉我一些信息,即:“该集合在 A N 次中找到”

我当然可以用 sql 和我最喜欢的脚本语言来实现它。但是,我想知道是否有更多 - 我猜是“正式” - 的方式来做到这一点。我有 weka 运行,我有我的数据库连接,但是我不知道要采用哪个分类器(许多拒绝服务)我也非常感谢一些理论背景的链接(例如它叫什么我喜欢做什么和存在哪些改进)。

如果您在 R 中更加通用,我也会欣赏“R”方式。(但是,我不仅对解决我的问题感兴趣,而且对了解这是什么类型的问题感兴趣——我会通过 weka 解决方案。)如果这在任何方面都是一个重复的问题,我很抱歉,但遗憾的是我缺乏信息来指定我在这里寻找的内容。学习和研究的可视化和其他输出会很棒,你。

在此先感谢您的阅读,希望对您有所帮助。

最佳答案

在 R 中你可以这样做:

foo = data.frame(A=c(1,1,1,4,7,7),B=c(1,2,9,2,8,11))
foo
#   A  B
# 1 1  1
# 2 1  2
# 3 1  9
# 4 4  2
# 5 7  8
# 6 7 11

table(foo[foo$B %in% c(1,2,8),]$A)

# 1 4 7 
# 2 1 1 

还需要什么吗?

关于r - 数值分类器(?)Weka/R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13445496/

相关文章:

R Shiny - 隔离使用 req() 检查先决条件的响应式(Reactive)表达式

r - 如何执行训练、测试和验证集来进行预测

java - 无法运行执行weka命令的java程序

c - 布伦特根查找算法的流行实现中的 "e"变量是什么?

c++ - 为 float 全局重载 == 和 !=

r - 观星者可以遵循 booktabs 风格吗?

r - 如何在 R 中使用冒号运算符编写 Java 风格的 for 循环?

machine-learning - Weka 没有 NominalToNumeric 过滤器

java - 在 weka 分类器中缩放训练数据

c++ - C++ 中的高斯勒让德