我遇到的问题是:我可能会收到其他系统的字符串,字符串里面可能会有一些不必要的空格,比如:“effective da te”,应该是“effective date”,这样可以吗有一个可以删除这种不正确空格的通用算法吗?
我试过RegExp,但问题是空格可能出现在任何单词中,另一个例子是:“not all field s apply to all scenari os - provide only the necessary data”
谁能提供一些建议?
JS 或 C# 解决方案是首选。
最佳答案
一种方法是去除所有空格并应用分词算法将连续的字母流拆分为有意义的单词序列。
This blog post描述了各种技术,并且 this github project提供一个实现。
关于javascript - 从混淆的字符串中识别正确的单词(随机位置的意外空格),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51779598/