对于在语言学习网络应用程序中的使用,您是否知道数据结构和底层数据库架构/布局可以有效地存储、处理和查询不同自然语言的句子、动词、名词等?例如,我想只存储每个动词一次并将句子链接到动词对象等。
我遇到了 concrete syntax trees我正在考虑使用抽象 Node 类并从中派生 Noun 类等。语法树结构会不会过于严格?
我意识到这是一个相当宽泛的问题,我不希望你做我的“功课”,但如果你能给我指出你知道的任何资源,这些资源可能会帮助我开始,我将不胜感激。
谢谢
马丁
最佳答案
您的示例在自然语言/句子操作方面看起来非常可靠。
关于其他选项.. 对于文本搜索/存储,您可以查看 Patricia tree .在 Google code 上用 Java 实现了它.
关于java - 高效的自然语言数据结构、持久化和查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3086073/