这是一个有趣的问题,就该领域的现有解决方案或研究而言,我不太了解,但我认为它与压缩领域有关。
给定两个可能很大的文本字符串,其中一个代表前者的更新版本,是否有可能(我知道这是可能的,我问的是真的有现有的解决方案)比较这两个字符串并将它们减少到一组差异,稍后可用于确定性地重建原始字符串?
在我的例子中,我有兴趣存储最新版本的字符串,但保留可以根据需要恢复的“压缩”(差异)历史备份,而不必实际存储所有重复信息。
我不知道要标记什么,请帮帮我。
最佳答案
CLR 中没有内置类支持差异化。
相关问题似乎有有用的信息(即 Creating Delta Diff Patches of large Binary Files in C# )。您还可以从“Delta 编码”开始搜索(即 http://en.wikipedia.org/wiki/Delta_encoding)。
关于c# - C# 的可逆字符串差异(历史)算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5097459/