我正在从事一个业余项目,我必须在其中抓取不同的网页,进行一些分析并回答一些查询。例如,网页可以包含如下数据:
One people injured in robbery.
Two people were injured in attempted robbery case last night.
Police is looking for the persons who injured three persons in attempted robbery.
我有兴趣回答这些事件中有多少人受伤等问题。我的问题是我该怎么做。是否有任何库可以帮助我完成这项任务?
最佳答案
试用 Stanford CoreNLP演示。它用作词性标记器的一部分。它生成 XML 输出和 pretty-print 输出,并将“一名男子在抢劫中受伤”中的“一”显示为数字。试试吧.. 这对你真的很有帮助。 然后,您可以使用 java 中的 DOM 解析器来解析 XML 文件,您可以通过检查文件中的“NER”标记并查看它是否为数字来轻松分离出“一”。
关于java - Java 中的语义查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11121349/