python - tqdm 可以与数据库读取一起使用吗?

标签 python pandas tqdm

在从 SQL 数据库读取大型关系到 pandas 数据帧时,最好有一个进度条,因为元组的数量是静态已知的,并且可以估计 I/O 率。它看起来像 tqdm模块有一个函数tqdm_pandas它将报告列上映射函数的进度,但默认情况下调用它不会像这样报告 I/O 的进度。是否可以使用tqdm在调用 pd.read_sql 时制作进度条?

最佳答案

编辑:答案可能具有误导性 - chunksize对操作的数据库端没有影响。请参阅下面的评论。
您可以使用 chunksize参数来做这样的事情:

chunks = pd.read_sql('SELECT * FROM table', con=conn, chunksize=100)

df = pd.DataFrame()
for chunk in tqdm(chunks):
    df = pd.concat([df, chunk])
我认为这也会使用更少的内存。

关于python - tqdm 可以与数据库读取一起使用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40282478/

相关文章:

python - 我不明白为什么 for 循环不起作用

python - Google App Engine 应用到私有(private)云

python - 相当于 MATLAB spy 的 scipy

python - 计算列中出现的频率

python - Pandas to pickle 错误 - 超过最大递归深度

python - 使用pytube下载管视频时如何添加tqdm以显示进度栏?

python - 如何禁用 tqdm 的进度条并仅保留 Pytorch Lightning(或一般的 tqdm)中的文本信息

python - 协调 basemap 箭袋和 matplotlib 箭头

python - 根据 Pandas 中唯一行值的数量添加新列

python - 如何在 jupyter 笔记本上制作嵌套的 tqdm 栏