python - 截断 pandas 数据框中的行数

标签 python pandas

有没有一种方法可以限制 pandas 数据框中的行数,或者最好通过索引来完成,例如:

LIMIT = 1000
df = df[:LIMIT]

我问这个的原因是我可能有百万行数据帧,我想确保这个调用尽可能高效,因为我会经常调用它。

最佳答案

有多种可用选项,但您需要具体说明您需要什么。

我个人使用这些设置:

##### widen output display to see more columns and rows in `pandas` ####
pd.set_option('display.height', 100)
pd.set_option('display.max_rows', 100)
pd.set_option('display.max_columns', 100)
pd.set_option('display.width', 100)
pd.set_option('expand_frame_repr', True)

(以上 100 个只是示例)。

提取pandas DataFrame的子集:

通常,这是如何对 DataFrame 的部分进行子集化:

df.loc[start_row:end_row, start_column:end_column]

DataFrame 中选择初始 n 行:

df[:1000]

关于python - 截断 pandas 数据框中的行数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53889409/

相关文章:

python jenkins.jenkins模块: how to login to jenkins with third party sso

python - f2py: 找不到可执行文件 C:Python27pythonw.exe 可执行文件 C:Python27pythonw.exe 不存在

python - 使用 Python 和 Pillow,我们如何计算 PNG 或 JPG 图像中唯一颜色的数量?

python - 将 Pandas 相关性转换为列

python-3.x - 如何从具有多个值和预定义类别的列表中创建虚拟对象?

python - 从字符串生成所有 n 元组

python - python字典中长(str)键的效率

python - 在 Pandas 中将每小时数据上采样为 5 分钟数据

Python如何将数据帧的两列组合成一个列表?

python - Pandas:上传到 mysql 表