python - 重新索引数据框 Pandas

标签 python pandas

我正在尝试拆分数据集以使用 Pandas 进行训练和测试。

data = pd.read_csv("housingdata.csv", header=None)
train = testing.sample(frac=0.6)
train.reindex()
test  = testing.loc[~testing.index.isin(train.index)]
print train
print test

当我打印数据时,我得到了

         0     1     2  3      4
9  0.17004  12.5  7.87  0  0.524
1  0.02731   0.0  7.07  0  0.469
5  0.02985   0.0  2.18  0  0.458
3  0.03237   0.0  2.18  0  0.458
7  0.14455  12.5  7.87  0  0.524
6  0.08829  12.5  7.87  0  0.524

         0     1     2  3      4
0  0.00632  18.0  2.31  0  0.538
2  0.02729   0.0  7.07  0  0.469
4  0.06905   0.0  2.18  0  0.458
8  0.21124  12.5  7.87  0  0.524

如前所述,行索引被重新排列。如何重新索引两个数据集中的行?

但这不会更改全局设置。例如,

train.iloc[0,4]

给出 0.524

最佳答案

正如@EdChum 的评论所指出的,您并不完全清楚您在寻找什么行为。但是,如果您只想为两个新数据帧提供从 0, 1, 2 ... n 开始的索引,那么您可以使用 reset_index() :

train.reset_index(inplace=True, drop=True)
test.reset_index(inplace=True, drop=True)

关于python - 重新索引数据框 Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40177288/

相关文章:

python - 合并 Pandas 中的两个时间序列并在阈值时间差内提取观察值

python - 使用 python pandas 从原始数据构建访问矩阵

python - plotly :如何从具有长格式或宽格式的 Pandas 数据框中绘制线图?

python - 如何使用 ctypes 将 python 列表传递给 C 函数 (dll)

python - 在pandas中,如何将数字类型转换为类别类型以与seaborn Hue一起使用

python - 如何从文件夹中读取每个文件并为每个文件创建单独的数据帧?

python - Pandas:如何根据多列的条件将值替换为 np.nan

python - 手动将图像像素值从 RGB 转换为灰度 python PIL?

python - 对不同的输入运行相同的计算两次,然后对两个结果执行进一步的计算

python - 不需要标签的一热编码?