text - 关于 "AUTOMATIC TEXT SUMMARIZER (lingustic based)"

标签 text nlp linguistics summarization

<分区>

我将“自动文本摘要器(语言方法)”作为我的最后一年项目。我收集了足够的研究论文并仔细阅读了它们。我仍然不太清楚“如何去做”的事情。基本上我找到了“AUTOMATIC TEXT SUMMARIZER (statistical based)”,发现它比我的项目要容易得多。我的项目指南告诉我不要选择这个(基于统计的)并选择基于语言的。

任何曾经从事过甚至听说过此类项目的人都会知道,总结任何文档都意味着对每个句子进行评分(通过涉及某些特定算法的某种方法),然后选择得分高于阈值的句子。现在这个项目最困难的部分是选择合适的评分算法并在以后实现它。

我的编程技能一般,想用 JAVA 编写代码(因为在那里我会得到很多 API,从而减少开销)。现在我想知道对于我的项目,我应该使用什么方法和算法。还有如何实现它们。

最佳答案

Using Lexical Chains for Text Summarization (Microsoft Research)

不同算法的分析:DasMartins.2007

文档中最重要的部分:

• Nenkova (2005) analyzes that no system could beat the baseline with statistical significance
• Striking result!

请注意,liguistic 方法有两种不同的细微差别:

  • 语言评级系统(这里都清楚)
  • 语言生成(重写句子以构建摘要)

关于text - 关于 "AUTOMATIC TEXT SUMMARIZER (lingustic based)",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/402440/

相关文章:

c++ - 将文件保存到用户在 C++ 中输入定义的位置和名称

actionscript-3 - 在AS3中创建带有阴影的文本

WPF 文本 block 与 List<string> 的绑定(bind)

java - 没有标点符号的文本中的句子注释

MySQL 自然语言搜索没有像我希望的那样工作

python - 使用Python提取包含单词的句子...以及它周围的句子?

tensorflow - 使用 Tensorflow 进行 IPA(国际音标)转录

java - 如何使用扫描仪类扫描文本文件,挑选出某些短语并对其进行计数?

c# - 从较长的字符串创建人类可读的短字符串

nlp - 在哪里可以找到德语的带有性别和复数的单词表?