ruby - 弄清楚在不良用户生成的内容中添加标点符号的位置?

标签 ruby algorithm language-agnostic nlp

有没有一种方法可以使用 NLP 或现有的库来为用户生成的不良内容添加缺失的标点符号?

例如,这个字符串:

今天是星期二我星期一去上类星期五休息

会变成:

今天是星期二。我星期一去上类。星期五休息。

最佳答案

我认为这个问题属于句子边界消歧 http://en.wikipedia.org/wiki/Sentence_boundary_disambiguation .我使用了 OpenNLP 变体并对结果感到满意。

关于ruby - 弄清楚在不良用户生成的内容中添加标点符号的位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22948506/

相关文章:

算法问题 : determining "user sessions"

ruby - 为什么 YAML 将 '0777' 解释为 511?

html - 最佳 Rails HTML 解析器

Ruby 的 ARGV 在 Windows 上可以为空,具体取决于运行脚本的方式

java - 打乱排序的子数组

算法问题: Best angle to view trees from fixed camera

language-agnostic - 在其他语言中使用时的 bean 模式名称是什么

ruby-on-rails - 邪恶中的混合取向.pdf

algorithm - 我怎么知道这些嵌套语句将执行多少次?

optimization - 为什么大多数语言不能优化 “0 * …”,并且有任何语言可以优化?