python - 如何找到数值、分类(MCQ-单项响应)和(MCQ-多重响应)之间的相关性?

标签 python machine-learning correlation categorical-data

我有一个包含数字、MCQ-单一响应和MCQ-多重响应的调查问卷数据集。总共有 22 列。数据集看起来像这样:

Age    ChooseTransport   WillgobyTrain  ....
52      1011001                 2
21      1000100                 1
25      1110000                 1
46      0001000                -1
32      1000001                 2

“年龄”是一个数值变量。 “ChooseTransport”是 MCQ- 具有 7 个选项的多重响应,其中 1 代表用户已选择该选项,0 代表未选择。 “WillgobyTrain”是 MCQ-单一响应并具有选择编号。

我想找到正确的方法来找出这些不同类型变量之间的相关性。

最佳答案

首先你应该拆分ChooseTransport分为 7 列,然后尝试使用 data.corr() (如果您的数据是 pandas.DataFrame )。

用于分割ChooseTransport试试这个:

for row_index, answer in enumerate(data['ChooseTransport']):
    for i in range(7):
        name = 'ChooseTransport_' + str(i)
        data.loc[row_index, name] = int(answer[i])

然后删除旧列 ChooseTransport :

data.drop(columns=['ChooseTransport'], inplace=True)

最后使用data.corr() :

data.corr()  

用于可视化使用 seaborn :

import seaborn as sns
sns.heatmap(data.corr())

关于python - 如何找到数值、分类(MCQ-单项响应)和(MCQ-多重响应)之间的相关性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49093704/

相关文章:

python - 如何使用 tf.data 创建图像序列样本?

machine-learning - "local solution"在svm中是什么意思?

Python-根据相关矩阵生成数字

python - 从 Pandas 中的相关矩阵创建列表

python - 相关热图

python - 对内部包含列表的列表进行二值化

python - 不支持 Pandas 逻辑回归混合类型?

R: 为什么pmap 不工作而map2 可以工作?

python - 连接多索引 Pandas 数据帧时出错(分类)

R Keras 压平层 - 得到形状为 1 的数组