我们需要将大量数据(大约 500 万条记录)导入 rails 应用程序下的 postgresql 数据库。 数据将以 xml 格式提供,其中包含使用 Base64 编码的图像。
xml 文件的估计大小为 40GB。 什么 xml 解析器可以在 ruby 中处理如此大量的数据?
谢谢。
最佳答案
您需要使用某种类型的 SAX parser . SAX 解析器不会立即将所有内容加载到内存中。
我不知道 Ruby 解析器,但很快 googling给了this blog post .您可以从那里开始挖掘。
您也可以尝试 split将 XML 文件分割成更小的部分,使其更易于管理。
关于ruby-on-rails - 将 500 万条记录导入 Rails 应用程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2825474/