有没有一种方法可以限制 pandas 数据框中的行数,或者最好通过索引来完成,例如:
LIMIT = 1000
df = df[:LIMIT]
我问这个的原因是我可能有百万行数据帧,我想确保这个调用尽可能高效,因为我会经常调用它。
最佳答案
有多种可用选项,但您需要具体说明您需要什么。
我个人使用这些设置:
##### widen output display to see more columns and rows in `pandas` ####
pd.set_option('display.height', 100)
pd.set_option('display.max_rows', 100)
pd.set_option('display.max_columns', 100)
pd.set_option('display.width', 100)
pd.set_option('expand_frame_repr', True)
(以上 100 个只是示例)。
提取pandas DataFrame
的子集:
通常,这是如何对 DataFrame
的部分进行子集化:
df.loc[start_row:end_row, start_column:end_column]
从 DataFrame
中选择初始 n
行:
df[:1000]
关于python - 截断 pandas 数据框中的行数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53889409/