Pandas 索引名称、轴标签和级别

标签 pandas

用于数据分析的 Python(2e,219)说:

enter image description here

但不幸的是,我很困惑。所以:

  • 什么是“索引名称”?
  • 什么是“轴标签”?
  • 什么是“轴水平”?
  • “行”和“列”属于哪一类?

最佳答案

考虑以下 DataFrame。

colidx = pd.MultiIndex.from_product([('Yes', 'No'), ('Yes', 'No')],
                                    names=['Heart Disease', 'High Blood Pressure'])
rowidx = pd.MultiIndex.from_product([('Female', 'Male'), ('Single', 'Married')], 
                                    names=['Sex', 'Marital Status'])

df = pd.DataFrame(np.random.randint(10, size=(4, 4), index=rowidx, columns=colidx))
Heart Disease          Yes     No   
High Blood Pressure    Yes No Yes No
Sex    Marital Status              
Female Single            5  0   3  3
       Married           7  9   3  5
Male   Single            2  4   7  6
       Married           8  8   1  6

这基本上是一个分为四个类别的交叉表。在行中,它有性别婚姻状况,在列中有心脏病高血压

它有四行四列。第一行的标签是(Female, Single)。 Wes 在本书中使用axis label 作为特定行或列的名称。对于行和列,pandas 使用与 numpy 相同的术语,行变为 axis=0,列变为 axis=1

一个轴可能有不同的级别。在示例 DataFrame 中,行或第 0 轴有两个级别:SexMarital Status。对于 axis=1,级别为 Heart DiseaseHigh Blood Pressure。您也可以分别称它们为索引名称列名称

关于Pandas 索引名称、轴标签和级别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45899612/

相关文章:

python - 如何连接具有不相等行数和不同列名的数据框

python - 如何对 groupby 结果的第一个值求和并将其写入相关组中的 df 列

python - 在 pandas 中计算阿隆指标的有效方法

Python pandas - 将多列转换为行

python - Python 中的样本数量不一致错误

python - 向 pandas DataFrame 添加新列时引发 TypeError

python - 如何在python中替换NaN值

pandas - 将 pandas 交叉表转换为堆叠数据框(常规表)

python - pandas:如何将嵌套 JSON 解包为数据帧?

python - 在Python pandas中,有没有办法提高数据帧到字典转换的速度?