python - 重新索引数据框 Pandas

我正在尝试拆分数据集以使用 Pandas 进行训练和测试。

data = pd.read_csv("housingdata.csv", header=None)
train = testing.sample(frac=0.6)
train.reindex()
test  = testing.loc[~testing.index.isin(train.index)]
print train
print test

当我打印数据时，我得到了

         0     1     2  3      4
9  0.17004  12.5  7.87  0  0.524
1  0.02731   0.0  7.07  0  0.469
5  0.02985   0.0  2.18  0  0.458
3  0.03237   0.0  2.18  0  0.458
7  0.14455  12.5  7.87  0  0.524
6  0.08829  12.5  7.87  0  0.524

         0     1     2  3      4
0  0.00632  18.0  2.31  0  0.538
2  0.02729   0.0  7.07  0  0.469
4  0.06905   0.0  2.18  0  0.458
8  0.21124  12.5  7.87  0  0.524

如前所述，行索引被重新排列。如何重新索引两个数据集中的行？

但这不会更改全局设置。例如，

train.iloc[0,4]

给出 0.524

最佳答案

正如@EdChum 的评论所指出的，您并不完全清楚您在寻找什么行为。但是，如果您只想为两个新数据帧提供从 0, 1, 2 ... n 开始的索引，那么您可以使用 reset_index() :

train.reset_index(inplace=True, drop=True)
test.reset_index(inplace=True, drop=True)

关于python - 重新索引数据框 Pandas，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40177288/

上一篇：python - 使用 Django 中的 ManyToManyField 的特定参数在表单中自定义查询

下一篇：Windows 上的 Python : Which pip

python - 使用 python pandas 从原始数据构建访问矩阵

python - plotly :如何从具有长格式或宽格式的 Pandas 数据框中绘制线图？

python - 如何使用 ctypes 将 python 列表传递给 C 函数 (dll)

python - 在pandas中，如何将数字类型转换为类别类型以与seaborn Hue一起使用

python - 如何从文件夹中读取每个文件并为每个文件创建单独的数据帧？

python - Pandas:如何根据多列的条件将值替换为 np.nan

python - 手动将图像像素值从 RGB 转换为灰度 python PIL？

python - 对不同的输入运行相同的计算两次，然后对两个结果执行进一步的计算

python - 不需要标签的一热编码？