string - 在大文本句子语料库中搜索句子

标签 string algorithm text

我是初学者,我想知道是否有办法在大量文本数据序列(比如 100 万)中搜索文本句子,并在用户键入时进行相应搜索:

I shouldn't be there

然后它应该像这样搜索序列:

I should not be there

类似这样:

I gonna go there.

I going to go there.

这几天一直在想办法解决这个问题 问题。

如果您知道如何处理这个问题,请提供解决方案,或者只是提示就足够了。谢谢。

最佳答案

我会首先检查句子和文本,并将所有缩写替换为长格式。然后再使用 Knuth-Morris-Pratt。

关于string - 在大文本句子语料库中搜索句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50543785/

相关文章:

.net - 在 Windows Powershell(或 dotNet 又名 .net)中执行 textwrap 和 dedent

javascript - 使用 javascript 和 MathJax 将数学公式字符串添加到文档

r - 计算字符串中连续字母的最大值

algorithm - Canny边缘检测器的时间复杂度

确定不同长度变化的算法

excel - 循环字符串,在分隔符之间提取数据

c - 返回由随机字母组成的字符串的指针的函数

algorithm - 查找/计算方法的复杂性

java - 将文件名与 id 进行匹配

css - 由文本表示的图像 - 它叫什么?