我是初学者,我想知道是否有办法在大量文本数据序列(比如 100 万)中搜索文本句子,并在用户键入时进行相应搜索:
I shouldn't be there
然后它应该像这样搜索序列:
I should not be there
类似这样:
I gonna go there.
到
I going to go there.
这几天一直在想办法解决这个问题 问题。
如果您知道如何处理这个问题,请提供解决方案,或者只是提示就足够了。谢谢。
最佳答案
我会首先检查句子和文本,并将所有缩写替换为长格式。然后再使用 Knuth-Morris-Pratt。
关于string - 在大文本句子语料库中搜索句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50543785/