我正在计划建立的网站上查看内容摘要。我更愿意为他们提供每个主题的摘要,而不是一页又一页的内容。
我想到了一些关于如何做到这一点的想法,主要是找到最常用的单词和写一个简短的表格。这确实有帮助,即使少一个字符也会有很大的不同。
是否有人愿意提出一些建议或指出正确算法的正确来源?我知道我必须自己开发算法,但在开始之前我正在做一些研究。
最佳答案
我认为这很好地概述了不同的摘要方法:http://en.wikipedia.org/wiki/Automatic_summarization
NLTK 工具包作为起点也应该非常有用:http://nltk.org/它已被用于构建汇总器,例如https://github.com/amsqr/NaiveSumm
关于c# - 一种总结内容的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16250110/