javascript - 从混淆的字符串中识别正确的单词(随机位置的意外空格)

标签 javascript c# text

我遇到的问题是:我可能会收到其他系统的字符串,字符串里面可能会有一些不必要的空格,比如:“effective da te”,应该是“effective date”,这样可以吗有一个可以删除这种不正确空格的通用算法吗?

我试过RegExp,但问题是空格可能出现在任何单词中,另一个例子是:“not all field s apply to all scenari os - provide only the necessary data”

谁能提供一些建议?

JS 或 C# 解决方案是首选。

最佳答案

一种方法是去除所有空格并应用分词算法将连续的字母流拆分为有意义的单词序列。

This blog post描述了各种技术,并且 this github project提供一个实现。

关于javascript - 从混淆的字符串中识别正确的单词(随机位置的意外空格),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51779598/

相关文章:

javascript - 查找重定向的img源

javascript - 单击按钮上的类(class)不会立即全部关闭

c# - Wix 自定义操作 - 从 XML 文件读取参数

python - 在python中解析一行的文本文件

Python 正则表达式和版权符号

android - 文本选择样式

javascript - 改变时,划掉表格

javascript - Jquery 填充输入或文本区域

C# 多态性 - 指定继承类型

c# - 按钮点击事件影响不同的窗口