pandas - 为什么数据框中的列名称旁边有符号?

标签 pandas dataframe python-3.5

我正在阅读 csv,但是当我仔细查看列名称时,第一个列名称旁边有一个奇怪的符号,任何人都可以帮我摆脱这个符号吗?

列名现在的样子(不确定“年份”旁边的符号是什么意思:

['year', 'sch', 'city', 'prop_id']

我希望列名称的外观:

['year', 'sch', 'city', 'prop_id']

到目前为止我的代码:

import pandas as pd

path = ('file_path')

cameron_county = pd.read_table(path + '/2016_GCC_prelim_appraisal_info_20160630.txt',
                             encoding = 'latin1',error_bad_lines = False)

print(cameron_county.head(1))
print(cameron_county.columns)

提前谢谢您。

最佳答案

这看起来像 unciode BOM 尝试一下

cameron_county = pd.read_table(path + '/2016_GCC_prelim_appraisal_info_20160630.txt',
                             encoding = 'utf-8',error_bad_lines = False)

参见:https://en.wikipedia.org/wiki/Byte_order_mark#Representations_of_byte_order_marks_by_encoding

 是 utf-8 BOM 十六进制代码的 CP1252 表示:EF BB BF

关于pandas - 为什么数据框中的列名称旁边有符号?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38724061/

相关文章:

python-2.7 - 在jupyter中选择python内核

jupyter-notebook - 如何为 jupyter notebook 设置 PYTHONHASHSEED?

python - pandas - 多索引切片未按预期调整索引值

python - 如何根据 Pandas 中字符串的出现有效地分配列值?

python - 将字符串持续时间列转换为以小时和分钟为单位的时间

Python - 从列表中搜索数据框中的字符串

python - cx_freeze 一直在 python/libs 中查找,而不是在已编译的库中查找

python - 在Python中优雅地求和命名的DataFrame列

python - 根据列名称在两列之间删除 pandas 数据框中的多列

python - 将 python pandas DataFrame 转换为 R dataframe 以与 rpy2 一起使用的问题