我倾向于将 .csv 文件导入 pandas,但有时我可能会获取其他格式的数据来制作 DataFrame
对象。
今天,我刚刚发现 read_table
作为其他格式的“通用”导入器,想知道 pandas 中读取 .csv 文件的各种方法之间是否存在显着的性能差异,例如read_table
, from_csv
, read_excel
.
- 这些其他方法是否比
read_csv
具有更好的性能? - 在创建
DataFrame
时,read_csv
与from_csv
有很大不同吗?
最佳答案
read_table
是用sep=','
替换成sep='\t'
的read_csv
,他们是围绕同一功能的两个薄包装器,因此性能将相同。read_excel
使用xlrd
包将 xls 和 xlsx 文件读入 DataFrame,它不处理 csv 文件。from_csv
调用read_table
,所以没有。
关于python - pandas read_table vs. read_csv vs. from_csv vs. read_excel 的性能差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31362573/