SQL 归因建模

标签 sql hadoop

*我花了几天时间谷歌搜索,找不到答案*

如何在 SQL(或我的情况下,Hadoop)中创建平等点击归因模型。

基本上,我想做的是观察客户旅程。

假设某人 A 在您的网站上购买了一辆汽车。

A 第一次通过 Google 找到您,然后再次通过 Google 找到您。然后几天后,通过电子邮件再次访问您的网站。最后,他手动输入您的网站地址并以 8,000 英镑的价格购买了这辆车。

做最后接触归因并说他是通过网站进来购买的,这很容易。

但是,在 SQL 世界中,你怎么说他买了一辆车,超过 4 次旅行,所以每次旅行值(value) 2,000 英镑 (8,000/4)。汽车是1/4的行程。

我想说的是: 谷歌,2 次旅程,0.5 辆汽车,4,000 英镑 电子邮件,1 次旅程,0.25 的汽车费用,2,000 英镑 网站,1 次旅程,0.25 辆汽车,2,000 英镑

我的字段是 channel 、orderid、日期、收入。我有一个客户使用的所有 channel 的列表,并创建了它们的数量。但我不确定如何在带有代码的数据库中按 channel 拆分订单。

承认失败并寻求帮助是一种耻辱。我正在尝试,但我无法让 SQL 执行此操作。有任何想法吗?

最佳答案

Select CustId, Sum(Revenue) As TotRev, Count(CustID) As JourneyCount, Sum(Revenue)/Count(CustID) As EqualClick
From Nico

关于SQL 归因建模,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39796739/

相关文章:

Sql Server 在插入语句后返回标识列的值

mysql - 在MYSQL中,行数多好还是列数多好?

hadoop - 在 Hive 中将 YYYY-MM-DD 日期转换为 YYYY-DD-MM

hadoop - Oozie 4.0.0 构建错误 - 无法解析 hcatalog 依赖项

php - 连接3张表获取数据

mysql - 想给mysql AND函数添加多个变量

mysql - 选择链接 MYSQL 上两个查询的结果

hadoop - 映射器中的多个输入文件夹位置

hadoop - 配置单元时间戳聚合

hadoop - 我的Dataproc集群(版本-1.4.0-debian9)HA模式不起作用