我正在开发一个用于对汽车照片进行分类的网络应用程序。用户将看到各种车辆的照片,并被要求回答一系列关于他们看到的问题。结果将被记录到数据库中,取平均值并显示。
我正在寻找算法来帮助我识别经常不投票的用户,这表明他们可能没有注意照片,或者他们在说谎。然后,我想排除这些用户,并重新计算结果,这样我就可以有把握地说,这张特定照片显示的车辆是这样那样的。
这个问题向所有计算机科学专业的人提出,在哪里可以找到这样的算法或为自己提供设计此类算法的理论背景。我假设我将不得不学习一些概率和静态,也许是一些数据挖掘。一些书籍推荐会很棒。谢谢!
附言这些是多项选择题。
所有这些都是很好的建议。谢谢你!我希望有一种方法可以在堆栈溢出上选择多个正确答案,这样更多的人可以因您的贡献而得到认可!!
最佳答案
阅读The Elements of Statistical Learning ,这是一本关于数据挖掘的优秀纲要。
您可能会对无监督算法特别感兴趣,例如聚类。假设大多数人不说谎,最大的那一簇是对的,其余的都是错的。相应地标记人物,然后应用一些贝叶斯统计,你就完成了。
当然,大多数数据挖掘技术都是实验性的,所以不要指望它们总是正确的……甚至在大多数情况下也是如此。
关于评估用户 react 的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1658131/