我想根据人们的兴趣将他们分组。例如。喜欢机器学习和图形的可以分到一个组,对数学、经济学等感兴趣的可以分到不同的组。
该算法应该能够根据人们的兴趣来决定哪些人的兴趣最匹配并创建集群。它还应该能够输出关于特定人所在组中其他人的信息。
最佳答案
这听起来不像是一个特别困难的聚类问题,任何现成的聚类算法都可能工作得很好。如果您知道需要多少个聚类,请尝试使用 k-means 或 k-medoid 聚类。如果您不知道有多少集群,请尝试凝聚集群。
问题的难点在于特征。您提到“兴趣”可以用作聚类的特征,但特征工程和选择总是会涉及一些试验和错误。
关于聚类具有相似兴趣的人的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18394608/