python - 如何获取特定格式列表中的相关特征?

标签 python pandas list series

我正在学习 Pandas 。我需要以下方面的帮助。 我试图从相关矩阵中找出最高相关的特征。

# Iris Dataset
features = ['sepal_length','sepal_width','petal_length','petal_width','class']
data = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data",\
                           header = None,\
                           names = features)
correlation = data.corr()
c = correlation.where(np.triu(np.ones(correlation.shape),k=1).astype(np.bool)).stack().sort_values(ascending = False)
highest = c[c>0.5]
print(highest)
print(highest.index)

上述代码片段的输出是:

petal_length  petal_width     0.962757
sepal_length  petal_length    0.871754
              petal_width     0.817954
dtype: float64
MultiIndex(levels=[['sepal_length', 'sepal_width', 'petal_length', 'petal_width'], ['sepal_length', 'sepal_width', 'petal_length', 'petal_width']],
           labels=[[2, 0, 0], [3, 2, 3]])

是否有可能将“最高”系列的输出转换为具有下面指定格式的列表?

list = [['petal_length','petal_width',0.962757],['sepal_length','petal_length',0.871754]['sepal_length','petal_width',0.817954]]

通俗地说,我需要系列列表中的索引列(两列)。

我尝试过这个并且它的工作原理。但我需要像上面这样的列表:

length = highest.shape[0]
list = []
for i in range(length):
    list.append(highest.index[i])
print('list =',list)

输出:

list = [('petal_length', 'petal_width'), ('sepal_length', 'petal_length'), ('sepal_length', 'petal_width')]

提前致谢。

最佳答案

是的,使用:

highest.reset_index().values.tolist()

输出:

[['petal_length', 'petal_width', 0.9627570970509667],
 ['sepal_length', 'petal_length', 0.8717541573048719],
 ['sepal_length', 'petal_width', 0.8179536333691635]]

关于python - 如何获取特定格式列表中的相关特征?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56974879/

相关文章:

python - 将新行追加到 Pandas groupby 结果对象

python - Pandas :Dataframe.replace() 与正则表达式

html - 当用户缩小窗口时,无序列表会崩溃

R:向量列表 - 将相同的向量分组在一起

python - 如何在具有不同定位的列表中获取字符串组合?

python - 存储到 MySQL 数据库时,非 Unicode 字符会更改为 "????"

python - 使用来自 win32com 的数据向 Excel 提供命名冲突 (_FilterDatabase)

python-3.x - 在seaborn箱线图中旋转xtick标签?

Python 3.6 在 AWS CodeBuild 中不可用,Python 3.5 在 AWS Lambda 中不可用

python - Tensorflow:如何在维数不变的情况下对张量进行切片?