用一句话(标题)描述我的问题不是很容易。我想通过问他们一些问题来找到一个人的兴趣,以便为他分配属性。
例如:在 10 个问题中(你喜欢技术吗?你对经济学感兴趣吗?你比读书更美食吗?),我希望能够找到人们的兴趣(技术,书籍阅读,经济学,... ) 以赋予他技术、文学、政治等属性,....我还希望我的程序从用户的答案中学习属性。
我正在寻找一种可以帮助我分配属性的算法。对我来说,它不是一个简单的二分搜索(20 个问题 AI 或类似的)算法,而是一个类似集群的 AI。
你对这个问题有什么建议吗?
最佳答案
首先,分类是有监督的学习,而聚类是无监督的。在监督学习中你可以这样想:
我已经对所有这些组进行了分类,并且我有一个新的个体/一组个体,哪个组最适合该个体? 在您训练模型时(例如:手动将电子邮件标记为垃圾邮件),您的个人最有可能被正确分类。
等效的问题,但在无监督学习中称为聚类,你有一个数据集,你没有模型可以支持,你想得到一个想法(这最适合探索性分析)你的数据是基于什么分组的一些指标(方差,同一组中每个人之间的平均距离,等等)。
您是否尝试过使用基于关联规则的学习?
关于algorithm - 分析/分类算法以将人们添加到兴趣组中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24914078/