我的程序中有一组数据输出,我想将其写入 .csv 文件。我可以用旧的输入数据创建一个新文件,然后是右边最后一列中的新数据。如何操作我的输出数据转到哪一列?另外,我如何选择不在我的新文件中包含旧的输入数据?我是 Pandas 的新手。
谢谢!
最佳答案
从文件加载:
import pandas as pd
df = pd.read_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Data\\train.csv', header = 0)
一些操作:
df['Gender'] = df.Sex.map(lambda x: 0 if x=='female' else 1)
df['FamilySize'] = df.SibSp + df.Parch
复制一些字段到新的:
result = df[['Sex', 'Survived', 'Age']]
删除不需要的字段:
del result['Sex']
保存到文件:
result.to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)
或者,如果您只想保存某些字段或按特定顺序保存:
df[['Sex', 'Survived', 'Age']].to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)
关于python - 用 Python Pandas 写入 to_csv : Choose which column index to insert new data,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31679108/