python - pandas read_table vs. read_csv vs. from_csv vs. read_excel 的性能差异?

标签 python performance csv pandas dataframe

我倾向于将 .csv 文件导入 pandas,但有时我可能会获取其他格式的数据来制作 DataFrame 对象。

今天,我刚刚发现 read_table 作为其他格式的“通用”导入器,想知道 pandas 中读取 .csv 文件的各种方法之间是否存在显着的性能差异,例如read_table, from_csv, read_excel.

  1. 这些其他方法是否比 read_csv 具有更好的性能?
  2. 在创建 DataFrame 时,read_csvfrom_csv 有很大不同吗?

最佳答案

  1. read_table 是用 sep=',' 替换成 sep='\t'read_csv,他们是围绕同一功能的两个薄包装器,因此性能将相同。 read_excel 使用 xlrd 包将 xls 和 xlsx 文件读入 DataFrame,它不处理 csv 文件。
  2. from_csv 调用 read_table,所以没有。

关于python - pandas read_table vs. read_csv vs. from_csv vs. read_excel 的性能差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31362573/

相关文章:

python - 用结构化字符串的内容填充结构化数组的比这更Pythonic(更短/高效)的方法?

python - 有没有办法在 Matplotlib 中制作不连续的轴?

javascript - ctx.lines() 在 Mac 上最多需要 8.7 秒,但在任何其他浏览器中不到 1 毫秒

c - Eventloop 具有高 ksoftirqd 负载; nginx 不会,但会执行相同的系统调用。为什么?

php - 在 PHP 中查询 mysql 并将数据导出为 CSV

python - 使用 python 删除重复的 CSV 条目

symfony - 从 Symfony2 生成并下载 CSV

python - Google Cloud Storage 访问客户端 API

javascript - 现代 JavaScript 引擎执行哪些优化?

python - 在脚本中成功但在 rc.local 中失败