regex - 如何从用户输入的句子中检测谁、什么、何时、何地

是否有一个好的算法/标记器/正则表达式或其他一些技术可以在用户键入时检测英语句子的哪一部分是“谁”、“什么”、“何时”和“何处”？

理想情况下，它可以在 Elastic Search、JavaScript 或 .net 中实现。

或者，也许可以检测句子的主语和动词。

如果它适用于英语，它是否可以国际化？

最佳答案

我不知道是否有针对所有这四个问题的特定技术，但已经针对每个问题进行了高级研究。

“Who”、“What”和“Where”可以通过命名实体识别来解析。( http://nlp.stanford.edu/software/CRF-NER.shtml )。

“何时”可能与时间标记领域更相关。(http://nlp.stanford.edu/software/sutime.shtml)。

检测主语、动词或任何其他词性的问题称为词性标记，为此存在许多库。

关于regex - 如何从用户输入的句子中检测谁、什么、何时、何地，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27359271/

相关文章：

machine-learning - 拼写检查器使用语言模型