php - PHP 文件中的 UTF-8 BOM 签名

标签 php utf-8 character-encoding byte-order-mark

我在编写一些带注释的 PHP 类时偶然发现了一个问题。我的名字(对于 @author 标签)以 ş 结尾(这是一个 UTF-8 字符,……我知道这是一个奇怪的名字)。

即使我将文件保存为 UTF-8,一些 friend 报告说他们看到那个字符完全乱七八糟 (È™)。通过添加 BOM 签名,这个问题就消失了。但是那件事让我有点困扰,因为我对它了解不多,除了我在维基百科上看到的以及在 SO 上的其他一些类似问题。

我知道它在文件的开头添加了一些东西,据我所知,这还不错,但我很担心,因为我读到的唯一有问题的场景涉及 PHP 文件。由于我正在编写 PHP 类来共享它们,因此 100% 兼容比在评论中出现我的名字更重要。

但我正在尝试理解其中的含义,我应该放心地使用它吗?还是有可能造成损害的情况?什么时候?

最佳答案

确实,BOM 是发送到浏览器的实际数据。浏览器会很高兴地忽略它,但您仍然无法发送 header 。

我相信问题确实出在您和您 friend 的编辑器设置上。如果没有 BOM,您 friend 的编辑器可能无法自动将文件识别为 UTF-8。他可以尝试设置他的编辑器,使编辑器期望一个文件为 UTF-8(如果您使用真正的 IDE,例如 NetBeans,那么这甚至可以作为您的项目设置可以随代码一起转移)。

另一种方法是尝试一些技巧:一些编辑器尝试根据输入的文本使用一些试探法来确定编码。您可以尝试以

开始每个文件
<?php //Úτƒ-8 encoded

也许启发式会得到它。可能有更好的东西放在那里,你可以谷歌搜索哪种编码检测启发式是常见的,或者只是尝试一些:-)

总而言之,我建议只修复编辑器设置。

哦等等,我误读了最后一部分:为了将代码传播到任何地方,我想你最安全的做法是让所有文件只包含低 7 位字符,即纯 ASCII,或者接受一些人古代编者看你名字写得好笑。没有万无一失的方法。 BOM 肯定是坏的,因为标题已经发送了。另一方面,只要你只在注释中放置 UTF-8 字符,一些编辑器误解编码的唯一影响就是奇怪的字符。我会努力正确拼写您的名字并添加针对启发式的评论,以便大多数编辑都能理解,但总会有人看到伪造的字符。

关于php - PHP 文件中的 UTF-8 BOM 签名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7870072/

相关文章:

不拆分表情符号的 JavaScript 子字符串

VIM - 菜单中没有 UTF-8

java - 扩展 Ascii 在控制台中不起作用!

java - 其余 Jersey json 编码

php - Laravel Command 参数返回键值对而不是值

php - WHOIS API JSON 数组内容

string - 如何生成一个由字母数字字符组成的随机字符串?

java - 使用 Cipher 和 Base64.Encoder 加密字符串时,目标字符集是什么?

php - 单个产品字段的 WooCommerce 多选

javascript - 如何检查来自用户收件箱的网页请求