我想弄清楚 GA 在保存 cookie 时使用什么编码。例如,我可以在设置 utm_source 参数时使用非西方字符,它们在 GA 报告中显示良好。但是,如果我查看 __utmz cookie,它与 utm_source 参数的值不匹配,而是似乎以某种方式进行了编码,我知道有 URL 编码,但这是不同的。
例子:
1) 访问 www.example.com?utm_source=ХЦЧШЩЬЫЪЭЮЯ
2) 查看 cookie。 __utmz cookie 保存为 utm_source 参数提供的任何值。它包含似乎已编码的值 ХЦЧШЩЬЫЪÐЮЯ。
3) 在网站上四处点击,然后查看 GA 报告。您将 ХЦЧШЩЬЫЫЪЭЮЯ 视为访问源,这是正确的。
我正在尝试编写一些 JavaScript 来读取 __utmz cookie 并将其保存在 Google App Engine 数据存储区中,然后在 HTML 页面中成功显示它。我已经尝试了所有类型的 encode(utf-8) decode(utf-8) 解决方案,但似乎没有任何效果。我认为这是因为我在设置 cookie 时没有使用原始编码。
最佳答案
使用的编码是UTF-8。当 ХЦЧШЩЬЫЪЭЮЯ 是 UTF-8 编码时,然后 UTF-8 编码值的字节显示为就好像它们是 windows-1252 编码一样,你会得到.例如第一个字符X,西里尔大写字母ha,是U+0425,UTF-8编码时是字节0xD0 0xA5。当这些字节被解释为 windows-1252(或 ISO-8859-1)编码的字符数据时,它们表示 U+00D0 U+00A5,即 Ð¥。
关于javascript - __utm cookie 的 Google Analytics 字符编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12829113/