我可以在 pandas df 中读取中间的行吗,就像我有一个包含 1000 万条记录的数据框,我想读取 200 万到 300 万条记录之间的记录。我知道我可以使用 skiprows 但这不能解决我的问题。
解决方法:
start_point = 2000000, number_of_records_to_be_loaded = 1000000 #2M-1M
pd.read_csv(file,skiprows=start_point,nrows=number_of_records)
最佳答案
您可以将可调用函数传递给 skiprows,以便 pd.read_csv
知道从哪里开始和停止(如果您想要更复杂的行选择操作,这会很有用)。对于您的问题,这有效:
pd.read_csv(filepath, skiprows=lambda x: x not in range(2000000,3000000))
编辑:正如您所建议的,以下内容也有效:
pd.read_csv(file, skiprows=2000000, nrows=1000000)
关于python - 从中间的 pandas df 读取行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69370097/