python - 使用pandas从python中现有的csv文件生成指定数量的新csv文件数据帧的方法

标签 python pandas

我在 Csv 文件 sample1 中有一个大数据帧,我必须从中生成一个只包含 100 个数据帧的新 Csv 文件。我已经为它生成了代码。但是我得到了关键错误,标签 [100] 是不在索引中? 我刚刚试过如下,任何帮助将不胜感激

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv")
data_frame1 = data_frame[:100]
data_frame.to_csv("C:/users/raju/sample.csv")`

`

最佳答案

正确的语法是 iloc :

data_frame.iloc[:100]

一种更有效的方法是使用 nrows 参数,其目的正是提取文件的一部分。这样您就可以避免浪费资源和时间来解析无用的行:

import pandas as pd
data_frame = pd.read_csv("C:/users/raju/sample1.csv", nrows=101)  # 100+1 for header
data_frame.to_csv("C:/users/raju/sample.csv")

关于python - 使用pandas从python中现有的csv文件生成指定数量的新csv文件数据帧的方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41965701/

相关文章:

python - 带有选择选项的 Django IntegerField(如何创建 0-10 整数选项)

python - 获取div属性val和div文本主体

python - 写入同一 Excel 文件中的多个工作表

python - 填充缺失的索引并将其值填充为 0

Python pandas 数据框添加前一行值

python集合列表在所有元素中找到对称差异

python - pandas groupby-apply 行为,返回一个系列(输出类型不一致)

python - 能够绘制为列表,无法绘制为 Pandas 系列

python - 如何将带有元组键的 python 字典转换为 pandas 多索引数据框?

python - 将 unhexlify 从 Python 2.7 移植到 Python 3.5