我有一个单词列表,假设
- Spring 数据
- Java
- C++
- 单位
我在文件或字符串中有一个非常大的文本
我需要找出列表中的每个单词,该单词在那个大字符串中出现了多少次?
我有点期待结果
- Spring 数据(10)
- Java (3)
- C++ (6)
- 单位 (0)
上面只是 4 个元素,但在我的例子中它可能多达几千个,我可以遍历每个元素并找到针对该字符串的 no.of 计数,但不确定考虑性能是否是最佳解决方案?你们能告诉我一些发现这个问题的最佳方法吗?
最佳答案
鉴于需要匹配包含空格的字符串,我倾向于循环遍历目标字符串列表,在文本中对该字符串进行适当转义的正则表达式搜索,并记录正则表达式匹配项的数量。
关于java - 从 Java 中的大字符串中查找单词列表及其计数的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40984971/