python - 波兰编码 - 分割问题

标签 python character-encoding

我有一个使用波兰语字符以 utf-8 编码的文件。 我需要做的就是玩一点文字游戏。但是当我使用 split("") 列表包含\xc5\x82 或\u0142

filename = 'patient.txt'
f = open(filename, 'r')
for line in f:
    print line
    print line.split(" ")
    print unicode(line,encoding(line),errors='ignore').split(" ")
f.close()

结果:

   Pacjent lat 48 został przyjęty do Oddziału z powodu spadku tolerancji wysiłku i duszności.
['\xef\xbb\xbfPacjent', 'lat', '48', 'zosta\xc5\x82', 'przyj\xc4\x99ty', 'do', 'Oddzia\xc5\x82u', 'z', 'powodu', 'spadku', 'tolerancji', 'wysi\xc5\x82ku', 'i', 'duszno\xc5\x9bci.']
[u'Pacjent', u'lat', u'48', u'zosta\u0142', u'przyj\u0119ty', u'do', u'Oddzia\u0142u', u'z', u'powodu', u'spadku', u'tolerancji', u'wysi\u0142ku', u'i', u'duszno\u015bci.']

我需要做什么才能在列表中包含波兰语字符?有可能吗?

问候
帕维尔

最佳答案

列表中已有波兰语字符。但是当您打印列表时,您只能看到其表示形式。

>>> print u'zosta\u0142'
został

关于python - 波兰编码 - 分割问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43559974/

相关文章:

python - 如何按值删除列?

python - 当我们不关心结果时异步 URLfetch? [Python]

character-encoding - ZPL 打印 € 和带有锐角符号的字符

java - 检查 UTF-8 数据类型 3 字节或 4 字节 Unicode

python - 如何列出系统中安装的所有Python版本?

Python 日志记录 : propagate messages of level below current logger level

java - Java字符集-如何从System.in获得正确的输入?

java - 在 MySQL 数据库中插入非英文文本时的 JSP 编码

仅在一个函数内重用代码的 Pythonic 方法