有没有一种方法可以使用 NLP 或现有的库来为用户生成的不良内容添加缺失的标点符号?
例如,这个字符串:
今天是星期二我星期一去上类星期五休息
会变成:
今天是星期二。我星期一去上类。星期五休息。
最佳答案
我认为这个问题属于句子边界消歧 http://en.wikipedia.org/wiki/Sentence_boundary_disambiguation .我使用了 OpenNLP 变体并对结果感到满意。
关于ruby - 弄清楚在不良用户生成的内容中添加标点符号的位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22948506/