computer-science - 在自然语言处理中，分块的目的是什么？

在自然语言处理中，分块的目的是什么？

最佳答案

分块也称为浅层解析，它基本上是识别语音部分和短短语(如名词短语)。 Part of speech tagging告诉您单词是否为名词，动词，形容词等，但它不提供有关句子结构或句子中短语的任何线索。有时候，拥有更多信息而不仅仅是单词的词性会很有用，但是您并不需要解析时得到的完整的解析树。

何时可能更希望使用分块的示例是Named Entity Recognition。在NER中，您的目标是找到命名实体，这些实体通常是名词短语(尽管并非总是如此)，因此您想知道总统巴拉克·奥巴马在以下句子中:

President Barack Obama criticized insurance companies and banks as he urged supporters to pressure Congress to back his moves to revamp the health-care system and overhaul financial regulations. (source)

但您不必一定在乎他是句子的主题。

分块也已相当普遍地用作其他任务的预处理步骤，例如基于示例的机器翻译，自然语言理解，语音生成等。

关于computer-science - 在自然语言处理中，分块的目的是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1598940/

上一篇：unit-testing - 一个难以进行单元测试的类是否设计得很糟糕？

下一篇：vim - 如何在 Vim 中水平拆分多个垂直拆分的窗口？

language-agnostic - 有没有理由用纯二进制编写代码？

c# - 预测两个 double 之和

java - 什么时候使用 TreeSet 比 HashSet 更快？

nlp - 对称二元谓词的基本一阶逻辑推理失败

nlp - 如何获得与在线演示完全相同的依赖解析输出？

python - 与 nltk 分块

algorithm - 选择排序算法的改进？

search - 如何避免遗传算法中的无效搜索空间？

python - 重新创建字符级RNN以生成文本