python - 在 Python 中检查有效的 utf8 字符串

标签 python json utf-8 invalid-characters

我正在从文件系统读取文件名,我想将它们作为 JSON 编码数组发送。问题是文件系统上的文件可以以无效编码存储,我需要处理这种情况以在将其传递给 json.dump 之前忽略无效文件名,否则它将失败。

有没有办法检查我的字符串(文件名)是否包含有效的 utf-8 字符?

最佳答案

试试下面的方法怎么样?

valid_utf8 = True
try:
    filename.decode('utf-8')
except UnicodeDecodeError:
    valid_utf8 = False

...基于对此处类似问题的回答:How to write a check in python to see if file is valid UTF-8?

关于python - 在 Python 中检查有效的 utf8 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5259135/

相关文章:

java - 使用 android studio 的 JSON

json - 需要帮助使用 Angular 4 发送此 curl 请求

php - 转储非 ASCII 字符时 DOMDocument 行为不一致的解释是什么?

python - 使用 Python 的 Windows 桌面 GUI 自动化—— sleep 与紧循环

python - 如何使用 python beautiful soup 从下面的 HTML 中获取标签和 ID 信息

android - 从主机读取 json 文件,在 Activity 中显示白屏 我该如何解决这个问题?

php - 为什么 PHP 和 Obj-C 对字符串的编码方式不同?

java - 字符串转 Utf-8 Java 双引号 "

python - 提取 pandas 中名称的值

python - 如何使用音频文件?