java - 为我指明 NLP 数据结构和搜索算法的正确方向

标签 java algorithm data-structures graph nlp

我的学校作业是制作一个能够猜测输入语言的语言分析器。作业指出,这必须通过预先解析语言定义的文本并对使用的字母、字母组合等进行统计,然后根据这些数据进行猜测来完成。

我们应该使用的数据结构是简单的多维哈希表,但我想借此机会学习更多关于实现结构等的知识。我想知道的是要阅读的内容大约。我对算法的了解非常有限,但如果有人能为我指明正确的方向,我很想学习。

在没有任何实际知识的情况下,只是阅读了不同的帖子,我目前正计划研究无向图作为字母组合的数据结构(以及以某种方式将统计数据存储在图中)和每个单词的 boyer-moore搜索算法。

我是不是完全走错了路,在这种情况下这些是不可能实现的,还是有其他更好的方法来解决这个问题?

最佳答案

如果您能拿到 Cormen 等人的副本。 《算法导论》

http://www.amazon.com/Introduction-Algorithms-Second-Thomas-Cormen/dp/0262032937

这是一本非常非常好的阅读数据结构和算法的书。

关于java - 为我指明 NLP 数据结构和搜索算法的正确方向,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5103790/

相关文章:

java - 如何使用 Spring Boot 让多个线程从 RabbitMQ 队列中获取数据?

algorithm - 如何根据赛车游戏的完成时间公平地分配一定数量的奖励积分给赛车游戏的玩家

java - 使用 Cucumber 运行 JUnit 测试后出现 NoSuchMethodError

java - 在 Java 中比较输入数据和 Sql 表的有效方法

java - 加权无向图上的最长路径

algorithm - 在没有递归的情况下在图中查找桥梁

c++ - C++二进制文件数据解析 : and the right STL for it?

php - 在 PHP 中,如何访问对象中的 ":private"数组?

sql - SQL Server varchar(max) 中的字符数?

java - 从 Java 启动外部进程 : stdout and stderr