c# - 如何在序列化之前检查类文件是否已更改?

标签 c# algorithm

我们有一个针对大量 C# 类型的自定义序列化过程。然而,为所有类/类型重新生成所有序列化信息非常耗时,我们计划通过计算文件的哈希值来优化序列化过程,如果不同,我们生成序列化输出,否则我们跳过它。 编辑: 我们可以将哈希存储在字典中,字典可以输出到文件并在处理时重新读取。这是目前的想法。

我们当前的序列化处理器的工作方式如下 - 我们将要序列化的类型添加到 repo:

SerializerRepo.Add(typeof(MyType)); //Add type to be serialized to a repo

然后(可能在代码的其他地方)让序列化程序处理 repo 并输出自定义 XML 等,

Serializer.WriteXML(SerializerRepo.GetTypes());

WriteXML遍历每种类型并在特定位置为每种类型生成一个 XML 文件。我需要优化 WriteXML方法仅在类/类型发生更改时对其进行序列化,否则顺其自然。

这可能不是最好的方法,我们欢迎重构建议。然而,当前的问题是如何确定容纳类/类型的类定义(或文件)是否已更改,以确定是否应生成 XML?

由于类型和对应的类之间没有内在关系,因为类可以是部分的,.Net 没有任何从类型到类文件的映射,反之亦然。但是,我们没有任何部分类。但在我们的例子中,我们似乎需要两条(虽然不相关)信息——包含类型/类的文件和类型本身。

目前有两个(可能不是最优的)想法:

  1. 要么我们让用户指定文件名和类型。但这不适用于更改文件名的任何类型的重构。

  2. 另一个解决方案是手动读取每个 .cs 文件并解析 public class <classname>并将其映射到每种类型。这似乎是一个巨大的开销,并且不确定这是否是一种可靠的方法。

这是我唯一的两个想法,但没有什么具体的。有什么建议吗?

最佳答案

将内存中 XML 的生成与将其保存到磁盘分开。

保留从完全限定的类名到散列的字典。第一次运行时,字典一开始是空的。

当需要确保一个类的相应 XML 在磁盘上是最新的时,在内存中生成它的 XML,对其进行散列,然后根据字典检查散列。如果类的名称不在字典中或者它的哈希与字典中的哈希不一致,则保留生成的 XML 并使用新哈希更新字典。

在您对所有类型完成此过程后,您将拥有一个完整的哈希字典。保存到磁盘并在下次运行此程序时加载它。

关于c# - 如何在序列化之前检查类文件是否已更改?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31731687/

相关文章:

c# - 如何在C#中相同命名空间的另一个窗口中编写代码

c - 连接长度为 L_N 的 N 个字符串的最佳方法?

algorithm - 给定高度的二叉搜索树的数量

algorithm - 匹配层次不精确图

c# - 将 switch 语句映射到数据类

c# - 是否有任何基于 .NET/CLI 的 C# 编译器实现?

c# - WPF MVVM 将 TextBlock 的文本绑定(bind)到 ObservableCollection 成员

algorithm - 我们是根据计算模型进行算法分析,还是根据 "common sense"进行算法分析?

在二叉树中查找一组 "k"标记顶点的算法,该算法最小化所有节点到标记祖先的距离

c# - 如何解决使用.net core 3.0加载互操作dll时找不到文件的问题?