c# - 一种总结内容的算法

标签 c# java c++ algorithm genetic-algorithm

我正在计划建立的网站上查看内容摘要。我更愿意为他们提供每个主题的摘要,而不是一页又一页的内容。

我想到了一些关于如何做到这一点的想法,主要是找到最常用的单词和写一个简短的表格。这确实有帮助,即使少一个字符也会有很大的不同。

是否有人愿意提出一些建议或指出正确算法的正确来源?我知道我必须自己开发算法,但在开始之前我正在做一些研究。

最佳答案

我认为这很好地概述了不同的摘要方法:http://en.wikipedia.org/wiki/Automatic_summarization

NLTK 工具包作为起点也应该非常有用:http://nltk.org/它已被用于构建汇总器,例如https://github.com/amsqr/NaiveSumm

关于c# - 一种总结内容的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16250110/

相关文章:

java - 如何使用 Hamcrest 的 AssertThat for String[]

c# - 为按需订阅授权信用卡并收取费用

java - 插件 Android 支持异常

java - 如何防止android应用程序因后台线程异常而崩溃?

C++/具有多个独立窗口的应用程序

c# - 如何以编程方式禁用网络摄像头二极管

c# - DLL 不导出类/方法 C#/C++

c# - 指定接口(interface)只能由引用类型实现 C#

c# TCP丢包

c++ - multiset如何存储重复元素?