python - 使用pandas从python中现有的csv文件生成指定数量的新csv文件数据帧的方法

我在 Csv 文件 sample1 中有一个大数据帧，我必须从中生成一个只包含 100 个数据帧的新 Csv 文件。我已经为它生成了代码。但是我得到了关键错误，标签 [100] 是不在索引中？我刚刚试过如下，任何帮助将不胜感激

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv")
data_frame1 = data_frame[:100]
data_frame.to_csv("C:/users/raju/sample.csv")`

最佳答案

正确的语法是 iloc :

data_frame.iloc[:100]

一种更有效的方法是使用 nrows 参数，其目的正是提取文件的一部分。这样您就可以避免浪费资源和时间来解析无用的行:

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv", nrows=101)  # 100+1 for header
data_frame.to_csv("C:/users/raju/sample.csv")

关于python - 使用pandas从python中现有的csv文件生成指定数量的新csv文件数据帧的方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41965701/

上一篇：python - 如何计算 python 中全行注释的行数？

下一篇：python - 使用分布式 Dask 调度程序重复执行任务

python - 获取div属性val和div文本主体

python - 写入同一 Excel 文件中的多个工作表

python - 填充缺失的索引并将其值填充为 0

Python pandas 数据框添加前一行值

python集合列表在所有元素中找到对称差异

python - pandas groupby-apply 行为，返回一个系列(输出类型不一致)

python - 能够绘制为列表，无法绘制为 Pandas 系列

python - 如何将带有元组键的 python 字典转换为 pandas 多索引数据框？

python - 将 unhexlify 从 Python 2.7 移植到 Python 3.5