algorithm - 大量小数据集的关联挖掘

标签 algorithm machine-learning data-mining

我有大量 (100-150) 个小型(大约 1 KB)数据集。 我们将这些称为“好”数据集。 我也有类似数量的“坏”数据集。

现在我正在寻找软件(或者可能是算法)来找到构成“好”数据集和“坏”数据集的规则。

这里重要的是软件能够处理多个数据集,而不仅仅是一个大数据集。

非常感谢帮助。
保罗。

最佳答案

这似乎是一个分类问题。如果您有许多标记为“好”或“坏”的数据集,您可以训练分类器来预测新数据集是好是坏。

决策树、k 最近邻、SVM、神经网络等算法是您可以使用的潜在工具。

但是,您需要确定将使用哪些属性来训练分类器。

关于algorithm - 大量小数据集的关联挖掘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9555076/

相关文章:

algorithm - 寻路算法测试工具

python - tensorflow 逻辑回归的准确性非常差

python - Keras:模型过度拟合?

tensorflow - 如何使用Tflearn构建词嵌入模型?

Python 线性回归误差

c++ - 这个矩阵博览会代码是对数的吗?

java - 圆圈中的Dijkstra算法

objective-c - Objective C 中的 MasterMind 评分算法

database - 数据挖掘小型数据集

c# - 预测中的蒙特卡罗模拟?