Pandas 索引名称、轴标签和级别

用于数据分析的 Python(2e，219)说:

但不幸的是，我很困惑。所以:

什么是“索引名称”？
什么是“轴标签”？
什么是“轴水平”？
“行”和“列”属于哪一类？

最佳答案

考虑以下 DataFrame。

colidx = pd.MultiIndex.from_product([('Yes', 'No'), ('Yes', 'No')],
                                    names=['Heart Disease', 'High Blood Pressure'])
rowidx = pd.MultiIndex.from_product([('Female', 'Male'), ('Single', 'Married')], 
                                    names=['Sex', 'Marital Status'])

df = pd.DataFrame(np.random.randint(10, size=(4, 4), index=rowidx, columns=colidx))

Heart Disease          Yes     No   
High Blood Pressure    Yes No Yes No
Sex    Marital Status              
Female Single            5  0   3  3
       Married           7  9   3  5
Male   Single            2  4   7  6
       Married           8  8   1  6

这基本上是一个分为四个类别的交叉表。在行中，它有性别和婚姻状况，在列中有心脏病和高血压。

它有四行四列。第一行的标签是(Female, Single)。 Wes 在本书中使用axis label 作为特定行或列的名称。对于行和列，pandas 使用与 numpy 相同的术语，行变为 axis=0，列变为 axis=1。

一个轴可能有不同的级别。在示例 DataFrame 中，行或第 0 轴有两个级别:Sex 和 Marital Status。对于 axis=1，级别为 Heart Disease 和 High Blood Pressure。您也可以分别称它们为索引名称和列名称。

关于Pandas 索引名称、轴标签和级别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45899612/

上一篇：sql - 在 BQ 中通过 STRUCT 聚合

下一篇：objective-c - 如何将数据从 native react 传递到 native iOS View ？

相关文章：

python - 如何连接具有不相等行数和不同列名的数据框

python - 如何对 groupby 结果的第一个值求和并将其写入相关组中的 df 列

python - 在 pandas 中计算阿隆指标的有效方法

Python pandas - 将多列转换为行

python - Python 中的样本数量不一致错误

python - 向 pandas DataFrame 添加新列时引发 TypeError

python - 如何在python中替换NaN值

pandas - 将 pandas 交叉表转换为堆叠数据框(常规表)

python - pandas:如何将嵌套 JSON 解包为数据帧？

python - 在Python pandas中，有没有办法提高数据帧到字典转换的速度？