java - 高效的自然语言数据结构、持久化和查询

标签 java database algorithm data-structures

对于在语言学习网络应用程序中的使用,您是否知道数据结构和底层数据库架构/布局可以有效地存储、处理和查询不同自然语言的句子、动词、名词等?例如,我想只存储每个动词一次并将句子链接到动词对象等。

我遇到了 concrete syntax trees我正在考虑使用抽象 Node 类并从中派生 Noun 类等。语法树结构会不会过于严格?

我意识到这是一个相当宽泛的问题,我不希望你做我的“功课”,但如果你能给我指出你知道的任何资源,这些资源可能会帮助我开始,我将不胜感激。

谢谢

马丁

最佳答案

您的示例在自然语言/句子操作方面看起来非常可靠。

关于其他选项.. 对于文本搜索/存储,您可以查看 Patricia tree .在 Google code 上用 Java 实现了它.

此外,您是否考虑过使用现有解决方案之一,例如 Hunspell , LuceneSphinx

关于java - 高效的自然语言数据结构、持久化和查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3086073/

相关文章:

java - java中的break语句有什么作用?

java - 是否可以使用 Spring 在两个不同的数据库(MongoDB 和 MySQL)中进行包含插入的事务?

java - Jsoup 没有获取完整的 html

java - 在 Spring Security 中使用 InMemoryDaoImpl

javascript - Parse.com 创建指针对象时出错

mysql - 如何正确编写带有 WHERE 子句的 sql 查询?

php - 是否有任何函数可以按相反顺序对数组进行排序?

algorithm - 负载均衡排序算法

algorithm - 这个组合优化问题是 NP 难的吗?

c# - 计算十亿元素列表中唯一元素的最快方法是什么?