python - 如何确定将哪些列设置为 Pandas DataFrame 中的索引?

标签 python pandas indexing dataframe

假设我有一个金融证券 DataFrame,它通常有多个标识符:

enter image description here

我应该只选择一列作为索引吗?我应该将所有可能的标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?最佳做法是什么?

最佳答案

这更多是关于数据库设计而不是 pandas。

决策应基于数据框(关系数据库中的表)及其列的业务含义。例如,如果在其业务中使用'Internal Security ID'来标识此类数据,则应将其设置为索引。

但是,如果您不确定,请坚持使用默认的整数索引。

关于python - 如何确定将哪些列设置为 Pandas DataFrame 中的索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41247713/

相关文章:

在 if 语句中检查 0 的 Pythonic 方法?

oracle - INSERT 和 UPDATE 操作中如何以及何时使用索引?

Python:从字典中获取索引

python - 如何在python中创建使用相同值初始化的特定类型的指定维度数组?

Python,概率

python - 如何在 ubuntu 17 上安装 ipython notebook?

python - pandas IndexSlice 不接受整数列表

python - 选择 Pandas 多索引数据框中只有 1 个条目的元素

Python如何在数据框中应用.replace以更改大量值

mysql在不同的服务器上运行不同的索引