c++ - 良好的 C++ 序列化设计

标签 c++ serialization architecture

我目前正在寻找一个好的 OO 设计来序列化 C++/Qt 应用程序。
想象应用程序的类基于树结构组织,使用复合模式实现,如下图所示。

我想到的两个可能的原则:

1.)
将 save()/load() 函数放在每个必须可序列化的类中。 如果多次看到这个,通常是用 boost 实现的。 在类里面的某个地方,你会发现这样的东西:

friend class boost::serialization::access;
template<class Archive>
void serialize(Archive & ar, const unsigned int version)
{
    ar & m_meber1;
}

您也可以将它分成 save() 和 load()。 但这种方法的缺点是:
如果您想在两个月后更改序列化(更改为 XML、HTML 或其他非常奇怪的东西,boost 不支持),您必须采用所有数千个类。 在我看来,这不是一个好的 OO 设计。
而且,如果您想同时支持不同的序列化(XML、二进制、ASCII 等等……),那么 80% 的 cpp 仅用于序列化功能。

2.)
我知道 boost 还提供了序列化的非侵入式版本

"http://www.boost.org/doc/libs/1_49_0/libs/serialization/doc/tutorial.html"

所以另一种方法是实现一个迭代器,它迭代复合树结构并序列化每个对象(以及一个用于反序列化的迭代器)
(我认为这是 .NET-Framework 的 XmlSerializer-Class 所做的,但我对 .NET 不是很熟悉)
这听起来更好,因为将 save() 和 load() 分开,并且如果序列化发生变化,则只有一处需要更改。
所以这听起来更好,但是:
- 您必须为要序列化的每个参数提供一个 setter() 和一个 getter()。 (所以,不再有私有(private)数据。(这是好是坏?))
- 你可以有一个很长的继承层次结构(超过 5 个类)卡在复合树上。
那么如何调用派生类的setter()/getter()呢? 当您只能调用基础 Composite-Component 的接口(interface)函数时。

另一种方法是将对象数据序列化为单独的抽象格式。 所有可能的后续序列化(XML、TEXT,任何可能的)都从中获取它们的数据。 一个想法是将其序列化为 QDomNode。 但我认为额外的抽象会降低性能。

所以我的问题是:
有谁知道一个好的序列化 OO 设计?
也许来自其他编程语言,如 JAVA、Python、C# 等等......

谢谢。

最佳答案

注意序列化。

序列化是关于拍摄内存中表示的快照并在以后恢复它。

这一切都很棒,除了当您考虑使用较新版本的软件(向后兼容性)或(上帝保佑)最近加载以前存储的快照时,它开始在接缝处磨损使用较旧版本的软件存储快照(向前兼容性)。

许多结构可以很容易地处理向后兼容性,但是向前兼容性要求您的新格式非常接近其先前的迭代:基本上,只需添加/删除一些字段但保持相同的整体结构。

问题在于,出于性能原因,序列化倾向于将磁盘上的结构与内存中的表示联系起来;更改内存中的表示则需要弃用旧文件(和/或迁移实用程序)。

另一方面,消息系统(这就是 google protobuf)是关于将交换的消息结构与内存中的表示分离,以便您的应用程序保持灵 active 。

因此,您首先需要选择是要实现序列化还是消息传递


现在您是对的,您可以在类内或类外编写保存/加载代码。这又是一个权衡:

  • 类内代码可以直接访问所有成员,通常更高效、更直接,但灵 active 较低,因此它与序列化密切相关
  • 类外代码需要间接访问(getter、访问者层次结构),效率较低,但更灵活,因此它与消息传递密切相关

请注意,隐藏状态 没有缺点。 没有(真正的)隐藏状态:

  • 缓存(可变值)就是这样,它们可以毫无顾虑地丢失
  • 隐藏类型(想想 FILE* 或其他句柄)通常可以通过其他方式恢复(例如序列化文件名)
  • ...

我个人使用两者的混合。

  • 缓存是为程序的当前版本编写的,并在 v1 中使用快速(反)序列化。编写新代码以同时使用 v1v2,并默认写入 v1 直到以前的版本消失;然后切换到编写 v2 (假设它很容易)。有时,大规模重构会使向后兼容性变得太痛苦,此时我们将其放在地板上(并增加主要数字)。
  • 另一方面,与其他应用程序/服务和更持久的存储(数据库或文件中的 blob)的交换使用消息传递,因为我不想在未来 10 年内将自己束缚在特定的代码结构中。

注意:我正在处理服务器应用程序,因此我的建议反射(reflect)了此类环境的细节。我想客户端应用程序必须永远支持旧版本......

关于c++ - 良好的 C++ 序列化设计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10902240/

相关文章:

C++ WMI 获取 AccountName 知道用户 SID

c++ - 嵌套在函数调用中的 initializer_lists 中的临时对象的生命周期

java - 需要是 LocalDate 的日期对象的正确类型

java - 服务层在实践中注入(inject)多个DAO

c++ - 我如何在没有 fstream 的情况下进行文件 i/o 来参加像 google code jam 这样的比赛?

c++ - gRPC 不会在 ubuntu 上为 c++ 生成库

c# - 如何在 C# 中获取异步 TCP 对象流?

java - 为什么即使没有无参数构造函数,我也无法序列化对象,即使它实现了 Serialized?

php - FOSElastica + JMs 序列化程序格式错误的数据

zend-framework - Zend Framework 应用程序中的事件