python - 如何过滤含有非ascii编码字符的行?

标签 python pandas encoding

我正在处理汉字excel。在我使用 读取 Excel 后

data = pd.read_excel(file, encoding = 'utf-8')

,我可以正常打印文件(我可以读取字符)。

但是,当我想按值过滤行时,出现以下错误:

Index = data[data[cols[0]] == "企业下属店铺销售记录"]]

UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal

我也尝试过Index = data[data[cols[0] == u"企业下属店铺销售记录".encode(encoding = 'UTF-8)]]

但它返回空数据框

P.S:我还在python文件的开头添加了# - *-coding: utf- 8 - *-

This is the return of data.iloc[:, 0]
    : Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
      result = libops.scalar_compare(x, y, op)
    1                 NaN
    2                企业信息
    4                企业名称
    5                客户分层
    6            企业下属店铺名称
    8                店铺名称
    9            名品城海外专营店
    10         anmum海外旗舰店
    11             企业征信信息
    13    近一年是否有欺诈与假货店铺处罚
    14         企业下属店铺销售信息
    16        最近30天日均销售金额
    17       最近30天日均销售订单数
    18        最近30天日均销售件数
    19      企业下属店铺菜鸟仓库存信息
    21      最近30天日均期末库存件数
    22        最近30天日均入库件数
    23      最近30天日均销售出库件数
    24        最近30天平均周转天数
    25         企业下属店铺销售记录
    27               店铺名称
    28           名品城海外专营店
    29           名品城海外专营店
    30           名品城海外专营店
    31           名品城海外专营店
    32           名品城海外专营店
    33           名品城海外专营店
    34           名品城海外专营店
    35           名品城海外专营店
    36           名品城海外专营店
               ...       
    54               货主名称
    55           名品城海外专营店
    56           名品城海外专营店
    57           名品城海外专营店
    58           名品城海外专营店
    59           名品城海外专营店
    60           名品城海外专营店
    61           名品城海外专营店
    62           名品城海外专营店
    63           名品城海外专营店
    64           名品城海外专营店
    65           名品城海外专营店
    66           名品城海外专营店
    67         anmum海外旗舰店
    68         anmum海外旗舰店
    69         anmum海外旗舰店
    70         anmum海外旗舰店
    71         anmum海外旗舰店
    72         anmum海外旗舰店
    73         anmum海外旗舰店
    74         anmum海外旗舰店
    75         anmum海外旗舰店
    76         anmum海外旗舰店
    77         anmum海外旗舰店
    78         anmum海外旗舰店
    79               企业评分
    81               店铺名称
    82               最终得分
    84               店铺名称
    85               最终得分
    Name: 菜鸟金融客户授信初审报告(机密), Length: 76, dtype: object

最佳答案

为什么不:

Index = data[data.fillna('').iloc[:, 0].str.contains(u"企业下属店铺销售记录")]

关于python - 如何过滤含有非ascii编码字符的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56536078/

相关文章:

python - 多条件计数 : pandas dataframe

python - 如何在数据帧之间随机分配值

python - 设置 pandas.read_table 字段和记录分隔符

PHP - FTP 文件名编码问题

python - numpy float的 "resolution"参数到底是什么

python - 使用 Telethon 库开发网关 - (Telegram)

python - xlwings:保存并关闭

php - PHP base64_encode 和 *nix base64 有什么区别

unicode - Erlang操作系统:cmd() command with UTF8 binary

python - 如何在python中使用pyarrow连接到hdfs