google-analytics - Google Analytics - 采样数据比 API 查询呈现更多 session

标签 google-analytics google-analytics-api

我正在使用 Core Reporting API V3 自动化 Google Analytics 报告。

当我为包含我之前定义的段的查询请求数据时,会发生以下情况

使用 API 获得的查询报告的 session 、用户和浏览量等指标高于谷歌分析报告中显示的指标。
我注意到在 GA 提交的报告中,他们提到他们是抽样的。
这引起了怀疑,因为我认为采样效果将具有比整个计数指标更低的指标。

这有什么意义? (非抽样报告中的指标水平高于抽样报告中的指标)

最佳答案

抽样只是意味着数据不太准确:它同样可能大于或小于真实值。

例如,假设我在一家拥有 10,000 名员工的公司工作。大奶酪想要对他们的员工进行非常详细的调查,以确保每个人都开心,但认为失去 10,000 小时的工作时间是不行的。相反,他们随机选择了 1,000 名员工。只要选择是真正随机的,那应该是一个有代表性的样本,这意味着这个群体的性别平衡、种族、有 child 的百分比、平均通勤时间等将与整个劳动力大致相同。

同样,如果您要求 Google Analytics 运行需要大量汇总的报告,它可能会决定只查看一半的数据。即使是最简单的请求也经常需要大量的计算;从他们的角度来看,在那个时期随机选择 40% 或 50% 的 session 并扩大结果要便宜得多。

他们随后将结果相乘以进行补偿,因此您看到的结果将大约等于真实值。最大的变化将出现在不经常发生的事情上。假设您有一个“某人刚刚花了 1,000 英镑”的事件,该事件可能每年举行一次。如果这随机出现在 Google 的样本中,它可能会决定它每年发生两次。否则,它可能认为它永远不会发生。

如果您面临大量采样,有几种方法可以避免它。我推荐以下内容:

  • 避免使用用户指标;这是最耗时的计算之一。
  • 保持你的时间段短。
  • 避免使用复杂的段。
  • 尽量不要一次使用太多维度。
  • 尽量不要有这么多的点击!你有很多多余的事件吗?您是否在多个站点上使用相同的代码?过度使用虚拟页面 View ?

  • 如果您有 Google Analytics Premium,您可以请求非抽样报告,但您应该注意为用户指标提供的导出总数;他们仍然搞砸了。

    采样可以以任何速率进行;在极端情况下,他们可能会将您的 session 减少到不到 1%。您应该对任何抽样统计数据持保留态度,但也要了解他们知道自己在做什么。如果您的样本量为 50% 或更多,那就没问题了。任何低于 40%,你应该开始担心。如果你得到的数据少于 1%,那么你实际上是在将 Google Analytics 延伸到极限之外,所以如果它没有尽最大努力帮助你,请不要感到惊讶。

    关于google-analytics - Google Analytics - 采样数据比 API 查询呈现更多 session ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37372114/

    相关文章:

    c# - 使用 .NET/C# 从 Google Analytics API 检索数据

    php - Google Analytics API 获取具有维度的数据

    javascript - CMS的Google Analytics API授权(单一授权)

    javascript - 谷歌分析 : how to use custom dimension on different website to identify intranet users

    asp.net - ASP.NET 如何在 </body> 标签前添加脚本代码

    google-analytics - 如何通过 rest api 使用 google 标签管理器检索 google analytics 事件跟踪数据?

    java - 谷歌分析的 setCredentialStore 方法的替代方法

    google-analytics - DoubleClick Floodlight 代码 : Expected URL match required?

    menu - 查看tabmenu点击Google Analytics(分析)

    android - 使用 google-services.json 时的 autoActivityTracking