python - pandas 的分类变量

标签 python pandas csv dataframe types

加载如下所示的 csv 文件时

0 1 male 3 4 5 6
1 0 female 6 7 8 9
.....

是否可以自动将第三列转换为整数,例如0代表男性,1代表女性?

最佳答案

read_csv接受名为 converters 的参数。这可用于在读入文件时将函数应用于特定列。converters 应作为以下形式的字典传入:

{column_index: function_to_apply}

您可以使用它来将函数应用于第三列。您需要做的就是设置函数从字典 d 中获取值,该字典将 "male" 映射到 0"女性”1:

>>> d = {"male": 0, "female": 1}
>>> pd.read_csv(file.csv, converters={2: d.get})
...
0 1 0 3 4 5 6
1 0 1 6 7 8 9
...

关于python - pandas 的分类变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27236599/

相关文章:

python:将数据帧放入字典中

javascript - R中将JSON格式转CSV上传数据表制作D3气泡图

python - 将 bool 字符串值映射到 JSON 中的 true/false

python - 优先选择附加的可选正则表达式组而不是点元字符

python - 将 3D Numpy 数组 reshape 为 2D 数组

python - 输入几何体具有未知 (0) SRID

python - 日期时间:从自身中减去日期得到 3288 天

python - python中最近5个数据集的聚合的持续更新

python - Keras回调导致错误: You must feed a value for placeholder tensor 'conv2d_1_input' with dtype float

vba - 使用excel vba从网站下载zip文件(如果还能够从zip文件中提取csv并在excel中打开它,那就更好了)