python - 自动文本摘要

标签 python django nlp summarization

我决定使用 Python/Django 开发一个自动文本摘要工具。

有人可以推荐有关如何入门的书籍或文章吗?

自动文本摘要有没有开源算法或制作项目可以让我了解这个想法?

另外,您愿意为我推荐 Django/Python 中具有挑战性的新 FYP 吗?

最佳答案

首先对于 Paper,我建议:

1- 最近的自动文本摘要技术:M.Gambhir 和 V.Gupta 的调查
2- 文本摘要技术综述,A.Nenkova

至于Python工具,我建议看看这些工具:

  1. 征服者:NLTK
  2. 王子:TextBlob
  3. 雇佣兵:斯坦福 CoreNLP
  4. 篡位者:spaCy
  5. 海军上将:gensim
    首先了解不同类型的总结以及最适合您的总结。另外,请记住确保您拥有适合目标语言的适当预处理工具,因为这对于摘要生成器的质量非常重要。

关于python - 自动文本摘要,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12444496/

相关文章:

python - 标记停用词生成的标记 ['ha' , 'le' , 'u' , 'wa' ] 不在 stop_words

python-3.x - MeCab 未正确解析

python - 如果存在其他标签,如何将键值对提取到字典中?

python - 在 DJANGO 中加载管理员和我的页面的 CSS 时出现问题

django - 使用 prefetch_lated(model_SET).all() 获取相关模型外键(除了 ManyToMany 之外)

python - 如何在开发人员之间管理 django 1.7 中的迁移?

java - 存储 DynamicLMClassifier (Lingpipe)

python - Python 中模运算符的逆运算

python - 使用 Raptor 或 Sax 验证 RDF 文件

python - 将由不同形状的 numpy 数组组成的 numpy 数组保存到 .txt 文件