我正在设计一个将 URL 作为输入并读取该 URL 的内容的 API。当 URL 是一个“文件:”协议(protocol)时,什么会为字符编码提供更好的默认值?
API 允许显式设置它。此外,我们可以使用一些启发式方法来确定字符编码,例如 BOM(如果可用),但是当所有这些都失败时,默认值应该是什么?
据我所知,标准在这个问题上保持沉默。在其他条件相同的情况下,我希望对那些甚至不知道有字符编码之类的东西的人来说,最常发生正确的事情。
最佳答案
如果可能,请始终使用 UTF-8,并将其记录在您的 API 文档中。 UTF-8 是一种坚如磐石的编码标准,而且非常面向 future ——我会通过支持其他编码来避免为自己产生潜在的工作——如果你迁移 API 以使用的方式,UTF-8 也将很容易使用它可以通过 Web 服务访问。
关于file - 使用文件 : protocol? 从 URL 读取的 API 的默认编码应该是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9180946/