我正在探索 Python 的文件存储格式选项并偶然发现了 Feather 。我注意到最后一个版本是在 2017 年,并且担心它的长期存在。
网络搜索正在撤回似乎都在 2017 年左右停止的帖子。
最佳答案
羽化格式仍然相关并且对更多数据类型的支持,尤其是在 R 端最近有了很大改进。一个显着的变化是它不再作为单独的包发布,而是作为 arrow
的一部分发布。/https://arrow.apache.org/ .在那里它被积极开发。
社区正在引领的另一种替代格式是 Apache Parquet。 Feather 和 Parquet 之间存在一些差异,因此您可以选择一种而不是另一种,例如Feather 按原样写入数据,Parquet 对其进行编码和压缩以实现更小的文件。此外,在 Java 世界中也可以使用 Parquet,这可能会派上用场。 Feather 和 Parquet 在 R 中都可用 arrow
库和 Python 作为 pyarrow
的一部分.
关于python-3.x - 如果 Feather 文件格式仍然相关,或者社区是否倾向于使用其他文件格式来存储大文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58719520/