python - 用 Python Pandas 写入 to_csv : Choose which column index to insert new data

标签 python parsing csv pandas

我的程序中有一组数据输出,我想将其写入 .csv 文件。我可以用旧的输入数据创建一个新文件,然后是右边最后一列中的新数据。如何操作我的输出数据转到哪一列?另外,我如何选择不在我的新文件中包含旧的输入数据?我是 Pandas 的新手。

谢谢!

最佳答案

从文件加载:

import pandas as pd
df = pd.read_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Data\\train.csv', header = 0)

一些操作:

df['Gender'] = df.Sex.map(lambda x: 0 if x=='female' else 1)
df['FamilySize'] = df.SibSp + df.Parch

复制一些字段到新的:

result = df[['Sex', 'Survived', 'Age']]

删除不需要的字段:

del result['Sex']

保存到文件:

result.to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)

或者,如果您只想保存某些字段或按特定顺序保存:

df[['Sex', 'Survived', 'Age']].to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)

关于python - 用 Python Pandas 写入 to_csv : Choose which column index to insert new data,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31679108/

相关文章:

python - 如何正确使用 pandas Series.map() 和映射字典?

python - 使用词云提高分辨率并删除空白边框

javascript - JSON.parse 适用于零元素数组 (node.js)

Java有效存储市场数据价格值(BigDecimal)

python - 如何在 PyTorch 中找到混淆矩阵并将其绘制为图像分类器

Python - 创建偏斜离散正态概率分布以采样整数

parsing - D 中的 gppg/gplex 等价物?

java - 渲染前从 webview 获取 Html

csv - 使用awk解析包含逗号的csv文件

c# - 使用 ODBC 从列名中包含空格的 CSV 文件中进行选择