ruby-on-rails - 将 500 万条记录导入 Rails 应用程序

标签 ruby-on-rails xml ruby parsing data-import

我们需要将大量数据(大约 500 万条记录)导入 rails 应用程序下的 postgresql 数据库。 数据将以 xml 格式提供,其中包含使用 Base64 编码的图像。

xml 文件的估计大小为 40GB。 什么 xml 解析器可以在 ruby​​ 中处理如此大量的数据?

谢谢。

最佳答案

您需要使用某种类型的 SAX parser . SAX 解析器不会立即将所有内容加载到内存中。

我不知道 Ruby 解析器,但很快 googling给了this blog post .您可以从那里开始挖掘。

您也可以尝试 split将 XML 文件分割成更小的部分,使其更易于管理。

关于ruby-on-rails - 将 500 万条记录导入 Rails 应用程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2825474/

相关文章:

mysql - 在现有项目上从 sqlite3 更改为 mysql

选项卡后面的 jquery UI 横幅背景图片

ruby-on-rails - 尝试在 Rails 应用程序中定义新模块时出错

ruby-on-rails - Ruby on Rails 版本之间的差异?我应该使用哪个?

java - 如何使用 XPATH 从 XML 中获取值

java - JAXB 中的自定义序列化

ruby-on-rails - 条件为 "if"的 Ruby Rails "false"实际执行了吗?

ruby-on-rails - 在 Rails 中实现具有灵活深度的类别和子类别的最佳方法?

xml - 在 Blackberry 中创建 XML 的更好方法

ruby-on-rails - 在 Mac 上安装 Ruby & Rails