我正在阅读 csv,但是当我仔细查看列名称时,第一个列名称旁边有一个奇怪的符号,任何人都可以帮我摆脱这个符号吗?
列名现在的样子(不确定“年份”旁边的符号是什么意思:
['year', 'sch', 'city', 'prop_id']
我希望列名称的外观:
['year', 'sch', 'city', 'prop_id']
到目前为止我的代码:
import pandas as pd
path = ('file_path')
cameron_county = pd.read_table(path + '/2016_GCC_prelim_appraisal_info_20160630.txt',
encoding = 'latin1',error_bad_lines = False)
print(cameron_county.head(1))
print(cameron_county.columns)
提前谢谢您。
最佳答案
这看起来像 unciode BOM 尝试一下
cameron_county = pd.read_table(path + '/2016_GCC_prelim_appraisal_info_20160630.txt',
encoding = 'utf-8',error_bad_lines = False)
参见:https://en.wikipedia.org/wiki/Byte_order_mark#Representations_of_byte_order_marks_by_encoding

是 utf-8 BOM 十六进制代码的 CP1252 表示:EF BB BF
关于pandas - 为什么数据框中的列名称旁边有符号?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38724061/