数据分析是机遇对业务的理解,发现业务中的问题或者是潜在的增长点,形成分析思路,并且利用数据分析工具进行分析,给出相应的结论和解决方案,并协调各方推动方案落地,解决问题,最后回到业务中去形成完整的闭环。
数据分析的主要流程:
观察现状
留意变化
多维、交叉分析
预测趋势
生成策略
推动落地
复盘效果
数据分析不是简单的数据统计,不能仅仅停留在输出一份诗句报告上,而是要给出相应的结论,讲清楚数据背后的业务含义,数字的大小正负说明业务的好坏,有多好或者有多坏。
明确数字背后的业务含义之外,还要给出背后的原因,好的方面是否可以复用拓展,坏的方面原因是什么?应对的方案是什么?要把方案推动落地到业务中执行,并且跟进执行的效果和复盘,螺旋上升,不断迭代优化。
1、确定数据来源是否可靠?
2、确定指标的计算口径是否统一?
3、明确是否是市场的整体趋势。
4、描述性统计:下跌了多少?
5、观察变化:同比下跌多少?环比下跌多少?
6、评估变化/方差分析:跌幅是否在合理范围之内?
7、交叉分析/相关性分析:对指标进行拆解,有哪些指标可能和日活跃相关,相关程度高达多少?
8、业务分析:这些指标的运营部门是否有某些策略或者活动造成了这些指标的变化,间接导致日活跃下降。
9、回归分析/预测:还会跌几天?跌幅最坏到达什么程度?
10、风险/损失评估:日活跃下跌对产品的核心KPI有什么影响?
11、制定策略:如何挽回损失/下次如何避免?
不同时期关注的指标不同,应该区别对待。
产品初期:关注产品的快速增长,会重点关注注册类指标;
产品成熟期:关注用户的使用黏性、深度等,会重点关注留存和活跃类指标。
蒙特卡洛法:一个边长为1的正方形和他的内切圆面积比为4/pi,通过随机生成x、y∈[0,1],落在圆内的个数N除以总个数M,即N/M=4/pi,即可求出圆周率。
分析CBD星巴克一个月的销售额有多少?
二八原则拆分:星巴克主要以饮品为主,饮品主要以咖啡为主。
1、从需求端估算:
饮品销量:
每天没人喝多少咖啡
CBD一共有多少人
咖啡的比例
每人每天喝几杯
非饮品销量
2、从供给段估算:
工作日供给
忙时供给
忙时每小时多少杯
一天多少忙时
闲时供给
闲时每小时多少倍
一天多少闲时
周末供给
忙时供给
忙时每小时多少杯
一天多少忙时
闲时供给
闲时每小时多少倍
一天多少闲时
指标室友业务含义的,体现业务变化的,不是瞎拍出来的,并且指标时复杂的,有特定的业务场景的;
指标口径:指标的定义,业务定义比如活跃用户数:打开APP的用户数;
指标一般与维度一起联合分析,从不同的维度看同一个指标可能会有差异和业务上的发现;
同一个指标可能会被应用于不同的业务,需要注意保证指标口径的统一,避免造成指标的歧义和误解。
指标:用于定量评估业务好坏程度而建立。
维度:描述指标的角度,可以理解为看问题的方面。
维度不能独立存在,一般都是搭配指标一起分析,可以分析不同维度下的同一指标,也可以多个维度较差,分析某一个指标,可能会有一些业务上的发现。
北极星指标也被称为第一关键指标,是指业务在当前阶段最为关注的一个指标,引导当前业务的发展。当然北极星指标也是一个比较汇总的指标,可以通过拆解拆分各个子指标,更便于整体指标的实现和分析。
常见的虚荣指标包括:累计用户数,累计销量、销售额等,都是只涨不跌的虚荣指标。
定义:一个指标不能叫体系,多个不相关的指标也不能叫体系,一个指标体系是多个相关的指标有机结合起来,具有严格的逻辑和分层体系。
建立方法:根据业务特点和生命周期选择第一关键指标,或者叫北极星指标;
贴合业务需求将第一关键指标进行逐层拆解,可以按流程拆、按时间区域拆、按公式加减乘除拆等;
从上至下:从顶层战略或从KPI拆解;
从下至上:叶子指标向上汇总成整体指标;
应用场景:监控关键指标变化趋势,判断业务走势;逐层拆解,定位业务异常原因;通过数据去定业务迭代;
定义:基于小样本的后验方法,通过设置对照组和实验组,对变量进行试验,通过假设对不同的结果进行检验,以检验变量是否对结果造成显著影响,从而选取最合理的方法。
核心逻辑:核心是用过随机合理分流,设置对照组和实验组,通过控制变量法,在保证两组用户除待验证变量不同外,其他变量分布均一致。分别对两组施加不同的变量,观察两组用户在同一时间内的表现,通过假设检验分析结果是否有显著差异,从而判断改动是否有效可执行。
应用场景:应用于产品功能,算法策略迭代等。
用户分流一定要随机均匀,保证各组的用户分布一致,用分桶和分层两种方式。同一层切分为不同的桶,各桶之间是互斥的,即一个用户只能在一个桶里面,当要同时进行多个实验的时候,分桶导致单个桶的流量过小,可以讲业务逻辑分为解耦的多层,不同的层共享同一批流量,这样一个瀛湖就可以进行多个实验,充分利用流量。
一种分组方式是分桶。我们直接讲真题永和分割为几桶,用户只能在一个桶中。但是这种情况很不现实,因为如果我们要同时上线多个实验,流量不够切怎么办?那为了达到最小样本量,我们就得延长试验周期。
假设检验:一般情况下,绝对值指标用T检验,相对值指标用Z检验。
单尾/双尾检验:单尾检验的前提是我们不仅认为两组指标不同,还明确了大小,一般情况下,我们都认为实验组的效果高于基线组。而双尾检验只是认为两组指标不同,没有明确大小。通常来说,我们更推荐使用双尾检验,因为实验本身就是一种利用数据来做决策的方法,我们不要认为的带入主管设想。而是用双尾检验,我们不仅能量话涨了多少,还能量化掉没多少,因为实验结果有正有负,不一定都是有效果的,还有可能有负向的效果,我们也可以将有负向效果的实验下来,成帝啊知识库,为后期实验避坑。
通过拆分业务流程,形成关键漏斗,分析漏斗各个环节的转化率/跳出率,定位问题发生的环节,漏斗分析最核心的有三点:分解流程、评估转化率和定位问题环节。
常见的漏斗有电商漏斗:首页-详情页-购物车-支付;还有用户的生命周期AARRR;用户行为周期AIDMA等。
需要注意的点:漏斗的各个环节一定是连续的,对应连续的业务流程;漏斗环节不宜过多,一般不超过5个;一般以上一个环节为基准,计算相邻两个环节的转化率;
计算每相邻环节的幻化率,1-转化率为流失率,但并不意味着转化率最低的环节就是问题环节;漏斗可以结合其他维度看,看不同维度下的漏斗差异进而判断是那个因素导致问题的出现;
数字本身是枯燥的,但是数字背后的信息确实很有趣的也很重要的。数据分析现在已经逐渐从变成一种能力,一种通用的技能,通过洞察数据背后的业务价值进而提出有指导性的建议,帮