python-3.x - 如果 Feather 文件格式仍然相关,或者社区是否倾向于使用其他文件格式来存储大文件?

标签 python-3.x feather

我正在探索 Python 的文件存储格式选项并偶然发现了 Feather 。我注意到最后一个版本是在 2017 年,并且担心它的长期存在。

网络搜索正在撤回似乎都在 2017 年左右停止的帖子。

最佳答案

羽化格式仍然相关并且对更多数据类型的支持,尤其是在 R 端最近有了很大改进。一个显着的变化是它不再作为单独的包发布,而是作为 arrow 的一部分发布。/https://arrow.apache.org/ .在那里它被积极开发。

社区正在引领的另一种替代格式是 Apache Parquet。 Feather 和 Parquet 之间存在一些差异,因此您可以选择一种而不是另一种,例如Feather 按原样写入数据,Parquet 对其进行编码和压缩以实现更小的文件。此外,在 Java 世界中也可以使用 Parquet,这可能会派上用场。 Feather 和 Parquet 在 R 中都可用 arrow库和 Python 作为 pyarrow 的一部分.

关于python-3.x - 如果 Feather 文件格式仍然相关,或者社区是否倾向于使用其他文件格式来存储大文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58719520/

相关文章:

c++ - R: 安装feather包时编译报错 "ISO C++ forbids in-class initialization of non-const static member"

python-3.x - 安装 Feather 格式降级几个包

python - 将 Pandas DataFrame 与 In-Memory Feather 相互转换

python - 如何用相同的代码满足不同的字符串格式化场景?

python - 创建可以跨流程比较的变量

javascript - 如何正确读取 pyarrow 生成的 Apache Arrow Feather 文件?

python - 在 plotly dash Store 中比 json 更快的序列化(pickle,parquet,feather,...)?

python - 超链接样式在 xlsxwriter python 中使用 set_column 不起作用

python - 如何在 Python 的某些条件下根据其他列表中的索引列表从一个列表中查找字符串?

python - 从 Pandas Dataframe 的列中删除 URL