Clickhouse(流量分析(一).漏斗分析案例)

如题所述

第1个回答  2022-07-14
神策用户分析模型——漏斗分析的使用方法

Clickhouse数据模型之有序漏斗分析

Hologres漏斗分析函数

Java UDF StarRocks Docs

window — 滑动窗户的大小,单位是秒。
mode - 这是一个可选的参数。
‘strict’ - 当 ‘strict’ 设置时,windowFunnel()仅对唯一值应用匹配条件。
timestamp — 包含时间的列。 数据类型支持: 日期, 日期时间 和其他无符号整数类型(请注意,即使时间戳支持 UInt64 类型,它的值不能超过Int64最大值,即2^63-1)。
cond — 事件链的约束条件。 UInt8 类型。

如果数据在不同的完成点具有多个事件链,则该函数将仅输出最长链的大小

ClickHouse数组函数

漏斗分析模型

分析"2022-01-02"这天 路径为“浏览->点击->下单->支付”的转化情况

这个函数看起来很强大,但是少了点什么,我理解的流量分析滑动窗口不太一样

痛点:很显然,如果数据量超过100亿往上,clickhouse大概就拉了,比较好的方法还是结合bitmap进行编码,这里有篇文章可以参考一下的

每天数百亿用户行为数据,美团点评怎么实现秒级转化分析?

neighbor
uniqCombined | ClickHouse Docs
housepower/olap2018: 易观第二届OLAP漏斗算法大赛

上面这种是这样的,如果一个uid路径是4层,那么他可能走了第一层,着看产品的口径了,如果只算走了第一步的是1,走了四步的只算作4,那么就是上面这种口径

groupArray | ClickHouse Docs
Array Functions | ClickHouse Docs
Clickhouse中的Array类型