computer-science - 在自然语言处理中,分块的目的是什么?

标签 computer-science nlp

在自然语言处理中,分块的目的是什么?

最佳答案

分块也称为浅层解析,它基本上是识别语音部分和短短语(如名词短语)。 Part of speech tagging告诉您单词是否为名词,动词,形容词等,但它不提供有关句子结构或句子中短语的任何线索。有时候,拥有更多信息而不仅仅是单词的词性会很有用,但是您并不需要解析时得到的完整的解析树。

何时可能更希望使用分块的示例是Named Entity Recognition。在NER中,您的目标是找到命名实体,这些实体通常是名词短语(尽管并非总是如此),因此您想知道总统巴拉克·奥巴马在以下句子中:

President Barack Obama criticized insurance companies and banks as he urged supporters to pressure Congress to back his moves to revamp the health-care system and overhaul financial regulations. (source)



但您不必一定在乎他是句子的主题。

分块也已相当普遍地用作其他任务的预处理步骤,例如基于示例的机器翻译,自然语言理解,语音生成等。

关于computer-science - 在自然语言处理中,分块的目的是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1598940/

相关文章:

machine-learning - Apple 如何查找电子邮件中的日期、时间和地址?

language-agnostic - 有没有理由用纯二进制编写代码?

c# - 预测两个 double 之和

java - 什么时候使用 TreeSet 比 HashSet 更快?

nlp - 对称二元谓词的基本一阶逻辑推理失败

nlp - 如何获得与在线演示完全相同的依赖解析输出?

python - 与 nltk 分块

algorithm - 选择排序算法的改进?

search - 如何避免遗传算法中的无效搜索空间?

python - 重新创建字符级RNN以生成文本