python - 将 unicode 字符编码为 un​​icode 转义序列

标签 python json django unicode iconv

我有一个包含站点和地址的 CSV 文件。我需要处理此文件以生成一个 json 文件,我将在 Django 中使用该文件将初始数据加载到我的数据库中。为此,我需要将 CSV 文件中的所有特殊字符转换为 unicode 转义字符。

这是一个例子:

Örnsköldsvik;SE;Ornskoldsvik;Ångermanlandsgatan 28 A

应该转换为:

\u00D6rnsk\u00F6ldsvik;SE;Ornskoldsvik;\u00C5ngermanlandsgatan 28 A

以下站点正在执行我期望的转换:http://itpro.cz/juniconv/但我想找到一种从命令行 (bash) 或 python 中执行此操作的方法。我已经尝试使用 iconvuconv 和一些 python 脚本,但没有真正成功。

juniconv网站背后运行的是什么脚本?

提前感谢您的任何建议。

最佳答案

如果你想得到Unicode escapes similar to Java在 Python 中;你可以use JSON format :

>>> import json
>>> import sys
>>> s = u'Örnsköldsvik;SE;Ornskoldsvik;Ångermanlandsgatan 28 A'
>>> json.dump(s, sys.stdout)
"\u00d6rnsk\u00f6ldsvik;SE;Ornskoldsvik;\u00c5ngermanlandsgatan 28 A"

还有 unicode-escape 编解码器,但你不应该使用它:它会产生 Python 特定的转义(Python Unicode 字符串文字的样子):

>>> print s.encode('unicode-escape')
\xd6rnsk\xf6ldsvik;SE;Ornskoldsvik;\xc5ngermanlandsgatan 28 A

关于python - 将 unicode 字符编码为 un​​icode 转义序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36888559/

相关文章:

django - 必须声明 PLS-00201 标识符 'PACKAGENAME.PROCEDURENAME'

python - 指示小时较小的 TimeField 的最佳方法是 'after' 小时较大的 TimeField

python - Pandas 将字符串列和 NaN( float )转换为整数,并保留 NaN

python - 指定在 doctest 套件中运行 testsetup block 的顺序

javascript - 如何获取内部具有不同键名称和内容的嵌套 json 数组数据?

javascript - 我是 javascript 新手,我正在从 url 获取 JSON 数据,我只能访问 success 函数中的数据,我是否遗漏了什么?

javascript - 将json多维转换为数组javascript

python - 如何限制对 Django 管理页面的访问?

python - 动态修改XML文件中特定属性的值

python - Writelines 写入没有换行符的行,只是填充文件