例如,如果我有一组博客文章,我想过滤掉那些可能与我自己有关或与某些标准无关的专业领域是什么?我知道我可以有一个单词列表来查找(其中很多是关于我自己或任何其他人的 - 组合不会结束),以进行过滤,但这不是可扩展的策略。 levenschtein 算法也会派上用场,但我认为这是一个完整的研究领域?
谢谢
最佳答案
关于algorithm - 根据某些标准过滤掉文本内容,例如关于我自己,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1581012/