加载如下所示的 csv 文件时
0 1 male 3 4 5 6
1 0 female 6 7 8 9
.....
是否可以自动将第三列转换为整数,例如0代表男性,1代表女性?
最佳答案
read_csv
接受名为 converters
的参数。这可用于在读入文件时将函数应用于特定列。converters
应作为以下形式的字典传入:
{column_index: function_to_apply}
您可以使用它来将函数应用于第三列。您需要做的就是设置函数从字典 d
中获取值,该字典将 "male"
映射到 0
和 "女性”
到 1
:
>>> d = {"male": 0, "female": 1}
>>> pd.read_csv(file.csv, converters={2: d.get})
...
0 1 0 3 4 5 6
1 0 1 6 7 8 9
...
关于python - pandas 的分类变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27236599/