twitter - 根据相似性对标签进行分类

标签 twitter machine-learning nlp text-analysis

我有不同的文档,每个文档中都有主题标签列表。我想将它们分组在最相关的主题标签下(该标签将出现在文档本身中)。 例如:如果有#Eco、# EcoFriendly # GoingGreen - 我想将所有这些都分组在最相关和最具代表性的标签下(比如#Eco)。我应该如何解决这个问题以及我应该考虑哪些技术和算法?

最佳答案

我将创建文档主题标签的二分图并在二分图上使用聚类: http://www.cs.utexas.edu/users/inderjit/public_papers/kdd_bipartite.pdf

这样我就不会使用文档的内容,而只是对主题标签进行聚类,这就是您想要的。

关于twitter - 根据相似性对标签进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24031279/

相关文章:

iphone - 在 iPhone 上打开推文会导致 404

machine-learning - 首次访问与每次访问 Monte Carlo

R函数式编程: using apply family to calculate kernel matrix for gaussian processes

nlp - 损失函数负对数似然给出损失,尽管完美的准确性

computer-science - 在自然语言处理中,分块的目的是什么?

ios - 如果未设置 Twitter,让 Twitter 显示转到我的设置页面的选项? iOS5+

ios - Twitter iOS 用户登录

objective-c - iOS 版 Twitter,oauth_nonce 并发送帖子请求?

python - Keras 模型为多标签图像分类提供非常低的训练和验证精度

algorithm - Levenshtein Automata 和 Damerau-Levenshtein 距离算法有什么区别?