file - 使用文件 : protocol? 从 URL 读取的 API 的默认编码应该是什么

标签 file url character-encoding api-design

我正在设计一个将 URL 作为输入并读取该 URL 的内容的 API。当 URL 是一个“文件:”协议(protocol)时,什么会为字符编码提供更好的默认值?

  • 系统原生编码
  • UTF-8

  • API 允许显式设置它。此外,我们可以使用一些启发式方法来确定字符编码,例如 BOM(如果可用),但是当所有这些都失败时,默认值应该是什么?

    据我所知,标准在这个问题上保持沉默。在其他条件相同的情况下,我希望对那些甚至不知道有字符编码之类的东西的人来说,最常发生正确的事情。

    最佳答案

    如果可能,请始终使用 UTF-8,并将其记录在您的 API 文档中。 UTF-8 是一种坚如磐石的编码标准,而且非常面向 future ——我会通过支持其他编码来避免为自己产生潜在的工作——如果你迁移 API 以使用的方式,UTF-8 也将很容易使用它可以通过 Web 服务访问。

    关于file - 使用文件 : protocol? 从 URL 读取的 API 的默认编码应该是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9180946/

    相关文章:

    android - 如何以编程方式写入 Android 中的 DocumentFile?

    c# - 在 C# 中下载 HTML 页面

    java - Tomcat URL 认证例如 : https://user:password@app. wibble.com

    macos - Git check out /删除带有特殊字符的文件

    ruby - 获取ruby中的直接子目录

    ruby-on-rails - Ruby on Rails : How to render file as plain text (without any HTML)

    python - 从 Flask 路由中的 URL 获取变量

    visual-c++ - VS C++ 字符集编译器设置是否影响字符编码?

    utf-8 - 字符编码问题 - 英镑符号 (£) 与 UTF-8 IE6/ASP/XML 的奇怪行为

    javascript - 调用 javascript 文件类型