<分区>
我将“自动文本摘要器(语言方法)”作为我的最后一年项目。我收集了足够的研究论文并仔细阅读了它们。我仍然不太清楚“如何去做”的事情。基本上我找到了“AUTOMATIC TEXT SUMMARIZER (statistical based)”,发现它比我的项目要容易得多。我的项目指南告诉我不要选择这个(基于统计的)并选择基于语言的。
任何曾经从事过甚至听说过此类项目的人都会知道,总结任何文档都意味着对每个句子进行评分(通过涉及某些特定算法的某种方法),然后选择得分高于阈值的句子。现在这个项目最困难的部分是选择合适的评分算法并在以后实现它。
我的编程技能一般,想用 JAVA 编写代码(因为在那里我会得到很多 API,从而减少开销)。现在我想知道对于我的项目,我应该使用什么方法和算法。还有如何实现它们。