编辑导语:数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程,我们在日常工作中总会用到数据分析,它极大的帮助了我们看数据对比、细分数据等方面;本文作者介绍了数据分析三板斧,我们一起来学习一下。
前两天有个小伙伴问我关于数据分析相关的东西,说来惭愧,自己也不是特别擅长这块,只能说会些简单的应用。
先总结下现在了解的一些东西,等以后有更深的感悟之后再继续更新吧。
如题,本文主要是数据分析相关的一些东西,三板斧指的是趋势、对比、细分。
一、看趋势
顾名思义就是追踪数据的趋势变化,找到一些增长或者下降的拐点,然后去分析对应的原因,适用于一些指标的长期追踪或者衡量一些关键动作有无效果。
比如产品的核心指标是GMV,那肯定就需要定期关注增长的趋势是否正常、是否符合预期,在追踪的时候,自然而然就需要对比着来分析。
二、看对比
光看趋势不一定靠谱,因为某些指标是一直增长的,比如注册用户数,这个数据肯定是一直在增加,除非没有新用户进来了。
另外没有对比就没有伤害,比如你的增长速率是每年50%,觉得已经很不错了,也许你的竞争对手正在以每年500%的速率进行增长。
所以,通常情况下,数据会对比着来看,一方面是纵向比较,即自身和自身进行对比,另一方面是横向比较,即自身和别人进行对比。
纵向对比通常包括环比、同比:
- 环比就是本期统计数据与上期比较,比如拿2018年9月份的数据和2018年8月份的数据进行对比。
- 同比指的是本期统计数据和上一周期的同期数据进行比较,比如拿2018年9月份的数据和2017年9月份的数据进行对比。
通常情况下,我们在进行数据分析的时候大都会用本周的数据和上周的进行对比,或者用本月的数据和上个月的进行对比,然后控制不同的变量进行分析。
这里面需要关注一些周期性的波动,比如某些产品会有明显的周末效应;以我们的产品为例,DAU基本上是周一最低、周二周三持续低迷、周四小幅回血、周五下降、周六周日达到巅峰,然后持续循环。
之前有个其他部门的同事问我做了什么,为什么昨天的数据涨的很厉害;我翻了下,发现是周四,就告诉他和上周同期的数据对比下,然后把这个周期拉长一些,以周为单位再看下。
按照经验来看,大多数APP在小长假期间数据都会下跌,特别是春节这种节日,下降的会非常厉害。
遇到这种情况先不要方,先看看有没有新发版本,确认下埋点是否有异常,再看看是否处在节日影响范围内,和其它同周期的数据对比看下,之后再找找其他原因。
横向对比通常包括行业竞品、全站数据、测试AB组等。
和竞品对比,主要是为了了解我们目前做的怎么样,业界的领先水平是怎样的,虽然这部分数据很难获得。
全站数据通常指的是大盘数据,有可能你负责某个功能模块的时候发现数据涨了,最后绞尽脑汁也没分析出来原因;然后回头一看,哦,原来是整体的数据涨了,顺带着躺赢了一把。
测试AB组指的就是实验组和对照组了,控制不同的变量对比分析不同的结果。
三、看细分
通常情况下用的最多的就是数据细分,不仅能够追溯到问题发生的原因,还能为后续的一些动作提供参考依据。
本部分主要分为维度和度量、拆数据、拆用户和拆因子这几部分;维度和度量主要是概念说明,后面几部分则是具体如何看细分数据。
1. 维度和度量
很多时候数据分析都是通过不同的维度和度量进行交叉对比分析,找到一些可能的原因,然后再去验证猜想。
- 维度:指的就是分析数据的角度,比如城市、时间、浏览器、新老用户、操作系统、终端等。
- 度量:指的就是具体的数据值,比如UV、PV、转化率、跳出率等。
通常情况下,单独的数据值只能传递整体的概况,细分查看需要结合着维度。
比如整体DAU可能是在逐渐上升的,同时老用户的留存可能却是在下降的,如果我们只是看度量的话,有可能就被蒙蔽掉。
通常情况度量需要结合着具体业务来看,比如以一款内容型产品为例,用户最核心的路径是浏览内容——产生互动行为。
那需要关注的度量就是人均浏览时长、人均浏览条数、使用频次、点赞、评论、转发等互动行为。
在此基础上,再结合着新老用户、男女用户、年龄分布、地域分布、终端分布、行为差异等维度再来进行更细致的分析。
2. 拆数据
这部分就是基于数据本身来做一些拆解,可以分为单指标和多指标两种形式。
单指标主要是衡量功能本身的表现情况,比如说:
- 功能本身的深度:使用频次、使用时长、分布情况等;
- 功能本身的广度:使用人数、DAU%等;
- 功能本身的留存度:留存率;
- 功能本身的转化率:各环节转化率。
多指标主要是对其它关联指标的贡献,比如对目标值的贡献度,如留存率,转化率、相关性等;比如新用户阅读了X篇文章,留存下来的可能性会增加多少。
3. 拆用户
主要是针对用户本身进行分群,再结合着数据指标进行交叉对比,通常情况下可以按照用户的静态属性和动态属性进行拆分。
静态属性主要指新老用户、版本、终端、地域、操作系统、渠道等。
动态属性主要指用户的行为,比如按照用户的点击次数,用户购买商品的客单价,或者某个行为路径的操作步骤来进行分群。
结合着分析的目标,把数据和用户拆分之后,应该就能得到一些思路了,然后再继续分解和交叉对比,直到找到一些结论。
4. 拆因子
这部分主要指的是一种思考方式,尽量先把目标值抽象成一个具体的公式,然后再按照因子去拆解。
比如上司来找你说我们这段时间DAU下降了,你去分析分析是什么原因造成的。
那首先我们可以考虑一下DAU相关的部分都有什么,可以用这样一个公式来进行概括:
DAU=新增用户数+活跃用户数+回流用户数
先排除一下数据异常、周期性波动,再结合着这个公式来看下各因子的细分情况。
首先看下各部分的构成变化,是新用户下降,还是活跃用户下降,还是回流用户下降。
如果是新用户数下降,那就去看看最近一段时间新增的用户数有没有变化,是数量下降,还是质量下降;按照渠道和日期来拆解每天的新增数量,然后再拆解各渠道的留存率看看。
如果是活跃用户数下降,就按照新老用户的留存率对比分析看下,是新用户留下来的少了,还是老用户留下来的少了;前者就在新用户激活的路径上找找原因,后者就在最近新上的功能上找找原因。
如果是回流用户数下降,按照回流的渠道拆解一下,看推送、短信召回、活动召回等形式带回来的用户数有没有变化,然后再结合着具体的变化继续找对应的原因。
最后结合着分析出来的原因,产出初步的结论,后续做一些对应的动作进行干预,观察对应的数据指标变化。
四、最后
经过上面的层层细分和交叉分析,一种可能性是你找到了潜在可能的问题,然后去证实或者证伪了你的猜想,另一种可能性是怎么着也找不到原因。
这时候一般有三种解决方案:
- 一种是看能不能找找原始日志信息,翻翻用户的行为记录,看看用户到底在干什么,究竟卡在哪里了。
- 另一种是直接把这些用户拉出来,找找对应的联系方式,直接和用户沟通,做做用研。
- 最后一种是实在没辙了,通常情况下会归因于数据异常、自然增长、常规波动等。
以上,就是本文的主要内容,愿你有所收获,欢迎斧正、指点、拍砖。