假设我有一个金融证券 DataFrame,它通常有多个标识符:
我应该只选择一列作为索引吗?我应该将所有可能的标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?最佳做法是什么?
最佳答案
这更多是关于数据库设计而不是 pandas。
决策应基于数据框(关系数据库中的表)及其列的业务含义。例如,如果在其业务中使用'Internal Security ID'来标识此类数据,则应将其设置为索引。
但是,如果您不确定,请坚持使用默认的整数索引。
关于python - 如何确定将哪些列设置为 Pandas DataFrame 中的索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41247713/