python - 连接到 DataFrame 将给出两个单独的起始索引

标签 python pandas dataframe

我从两个 csv 文件中读取了两个数据帧。

train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")

train 数据框中,我有 891 行,在 test 数据框中,我有 418 行。

我将这两个数据帧连接成一个新的数据帧 full_data

full_data = pd.concat([train, test])

full_data 现在包含 1309 行,但问题是,默认生成的 index 对于两个数据帧都是分开的。两个 index 都是从一个开始的。

但我希望 test 数据帧索引应该从 892 而不是 0 开始。

我该怎么做?

最佳答案

concat 中使用参数 ignore_index=True :

full_data = pd.concat([train, test], ignore_index=True)

关于python - 连接到 DataFrame 将给出两个单独的起始索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50715249/

相关文章:

python - Listview 基于类的 View 无法正常工作

python - 无法从 Python 2.x 下 pandas 的列名中删除 unicode 字符

python - Pandas:Dataframe 计算 - 带除法的新行、带总和和平均值的新列

python - pretty-print 整个 Pandas Series/DataFrame

python - 使用重复单元格值作为键将 pandas DataFrame 转换为字典

python - SQLAlchemy 在多线程应用程序中正确的 session 处理

python - GraphQL + Django : resolve queries using raw PostgreSQL query

python - 文件 I/O 中的线程安全

python - Pandas 计算行的增长百分比

Python Pandas Dataframe 日期时间列分隔函数