我从两个 csv
文件中读取了两个数据帧。
train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")
在 train
数据框中,我有 891 行,在 test
数据框中,我有 418 行。
我将这两个数据帧连接成一个新的数据帧 full_data
。
full_data = pd.concat([train, test])
full_data
现在包含 1309 行,但问题是,默认生成的 index
对于两个数据帧都是分开的。两个 index
都是从一个开始的。
但我希望 test
数据帧索引应该从 892 而不是 0 开始。
我该怎么做?
最佳答案
在 concat
中使用参数 ignore_index=True
:
full_data = pd.concat([train, test], ignore_index=True)
关于python - 连接到 DataFrame 将给出两个单独的起始索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50715249/