performance - Pandas to_excel-如何使其更快

标签 performance pandas export-to-excel

我有一个具有12,000行和34列的数据框。 Pandas 大约需要15秒才能将此内容写入Excel。我读到的关于to_excel函数的讨论很少,而使其更快的一种方法是添加engine ='xlsxwriter'。我使用以下代码。

writer = pd.ExcelWriter('outputfile.xlsx',engine='xlsxwriter')
res_df.to_excel(writer,sheet_name='Output_sheet')

想知道是否有一种方法可以使用dask或任何其他库使此工作更快?

dataframe.memory_usage()给了我以下输出:
Index   80
col1    95528
col2    95528
col3    95528
col4    95528
col5    95528
col6    95528
col7    95528
col8    95528
col9    95528
col10   95528
col11   95528
col12   95528
col13   95528
col14   95528
col15   95528
col16   95528
col17   95528
col18   95528
col19   95528
col20   95528
col21   95528
col22   95528
col23   95528
col24   95528
col25   95528
col26   95528
col27   95528
col28   95528
col29   95528
col30   95528
col31   95528
col32   95528
col33   95528
col34   95528

谢谢!

最佳答案

您可以使用pyexcelerate来获得更快的速度。

from pyexcelerate import Workbook

values = [res_df.columns] + list(res_df.values)
wb = Workbook()
wb.new_sheet('sheet name', data=values)
wb.save('outputfile.xlsx')

关于performance - Pandas to_excel-如何使其更快,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41878092/

相关文章:

c - 如何有效地将两个16位字逐位组合成一个32位字?

mysql - 如果 mysql (mariadb) 服务正在运行,Linux 服务器运行缓慢

python - 带有热图调色板的条形图

javascript - 我应该如何使用 PHP Excel 将 MYSQL 数据导出到 Excel

java - report.xlsx 的文件格式和扩展名不匹配

java - java 对象的通用导出到 Excel

r - 如何通过替换 "for-loop"和 "if-else"子句来提高大型数据集的性能

algorithm - 大型 RTS map 上的 FlowField 寻路

python-3.x - 屏蔽与另一组数据不相等的数据并存储结果

python - Pandas 加入问题 : columns overlap but no suffix specified