2023年7月29日发(作者:)
我是这么做指标异动分析的。现在异常排查类的需求⾮常多,会占⽤分析师⽐较多的⼈⼒精⼒,从排查思路、提取数据、统计分析再到分享原因,⽽且⼀般异动分析还相对紧急。可是从分析师的⾓度考虑,异动分析,对个⼈价值并不⾼,并且对业务的发展价值也很⼀般,属于紧急不重要的象限。所以希望能够⽤数据产品来解决异常排查类的分析,包含AB实验的不满⾜预期、发版的不满⾜预期、指标的不满⾜预期,从⽽释放⼈⼒,去做更有价值的策略分析。最近学习了⾏业上⼀些常见的根因分析算法,其中之⼀是微软的Adtributor,⾏业上应⽤⽐较多。⼀、关于Adtributor算法的基本介绍解决了什么问题对异常问题进⾏归因,定位到具体的维度和维度下的具体元素能解决什么指标的问题量值指标,具有可加性,⽐如页⾯访问PV、收⼊、内容/APP分发量率值指标,从量值指标衍⽣⽽来,⽐如CPM、下载的应⽤启动率使⽤的原则奥卡姆剃⼑:形式尽可能的简单找出最令⼈吃惊的元素(实际值和预测/对照相差最⼤的维度及元素)贪婪算法:尽可能解释指标的异动算法的基本思维简述 计算每个维度下对绝对波动的贡献度⽐如我的⽇常收⼊由⼯资1000、投资500构成,结果这个⽉⼯资变成了1400、投资变成了800。那总波动是700,其中⼯资贡献了波动的400/700,投资波动贡献了300/700。显然,收⼊的绝对贡献更⾼计算哪个构成元素最令⼈惊讶上述例⼦中,我的收⼊变化只有400/1000,⽽我的投资收⼊却改变了300/500,所以相对变化它要⾼的多,最令我吃惊然后会优先给到惊喜度⾼、能解释波动的元素作为归因因⼦算法的局限性限制于⼈的维度拆解,如果可能的因素不在⾥⾯,它也没办法会优先在⼀个维度⾥寻找可能的原因,难以考虑因素之间的关联关系量值类型/率值类型都要可叠加?原来的算法截图: ⼆、关于两种指标类型的实战案例量值类指标的分析步骤详细举例(以下数据和产品纯属虚构):背景:这⾥⾯的指标是分发量,可累加。维度是产品的模块。Adtributor算法使⽤的指标:EP、Surprise是算法中需要计算和使⽤的两个指标,公式如下图中所⽰:以下维度是⽤户年龄算法详细步骤:从上⾯看到,结果还是⼗分准确的,和⾁眼分析出来的是⼀样的~率值类指标的分析步骤详细举例(以下数据和产品纯属虚构):这是衍⽣指标的分母(和上⾯量值指标的计算没有任何区别)这是衍⽣指标的分⼦(和上⾯量值指标的计算没有任何区别)这⾥是衍⽣指标,它的EP和Surprise和量值指标的计算公式有所不同,会同时考虑到分⼦和分母可以看到⼤盘整体的激活率指标降低了12.4%,但是拆开看各个模块,激活率都没有变化。但是通过⾁眼观看分⼦分母,我们能够知道,分发模块的分发占⽐变化很⼤算法最终输出的结果,也是和我们⾁眼看到的模块是⼀致的算法能够定位到相关的维度(以及下⾯的元素),最终还需要⼈给出根本原因。
发布者:admin,转转请注明出处:http://www.yc00.com/news/1690625522a380964.html
评论列表(0条)