<分区>
我想创建一个应用程序,它可以通过读取两个文档中的文本并进行比较来确定是否在两个文档之间复制了某些文本。我想知道是否有人曾经尝试过这样做,以及处理相同问题的最佳方式是什么。如果涉及机器学习和自然语言处理:达到什么水平?
<分区>
我想创建一个应用程序,它可以通过读取两个文档中的文本并进行比较来确定是否在两个文档之间复制了某些文本。我想知道是否有人曾经尝试过这样做,以及处理相同问题的最佳方式是什么。如果涉及机器学习和自然语言处理:达到什么水平?
最佳答案
有些技术完全依赖于集合论概念
尝试 http://en.wikipedia.org/wiki/W-shingling一个好的开始。
关于java - 创建文档比较软件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10566854/