数据对比,是要考虑从不同维度进行对比,才能分析出问题的本质。
双十一,双十二,年货节接踵而至。
大促结束后,销售额、客单价、询单转化率……各种数据指标充斥着老板桌上的报告,运营人手中的PPT,以及我们产品人设计的数据产品中。
而“数据对比”作为数据分析中最常见的方法之一也被频繁运用,今天想通过“我有一个朋友系列”来和大家讨论下常见的数据对比。
孤数不证
我有一个朋友叫老王,经营了一家淘宝女装店,下面是老王最近的销售情况:
- 老王淘宝店今日销售额 10000元。
- 老王淘宝店今日销售额10000元,昨日销售额 8000元。
- 老王淘宝店今日销售额10000元,老王竞争对手老李的女装淘宝店今日销售额20000元。
从老王最近的销售情况不难看出,当只知道今日销售额 10000元,这个数据对我们是没有意义的,无法去判断这家淘宝店的情况。
而知道昨日销售额以及竞争对手今日销售额时,可以有一个简单的结论:销售额今日比昨日增加,今日销售额低于竞店数据。
由此我们可以得出一个结论:孤数不证。数据单独存在的时候不具备分析意义,数据的分析是基于对比进行的,好的数据分析方法也一定会用到对比。
在电商领域,数据对比可以说是司空见惯的存在。例如生意参谋首页今日和昨日支付金额的折线图,通过对比帮助用户了解今日和昨日支付金额在不同分时上的一个高低情况,以及整体的波动趋势。
图片来源于网络
时间维度的对比
在时间维度上的对比,往往会采用与从前比和与未来比两种对比方式。
与从前比,主要通过和历史数据的对比,来分析当前数据的价值,一般会考虑到和从前不同时期比、和从前相同时期比、和前一个统计期比、和历史的特殊值比。
和从前不同时期比
和从前不同时期的对比常用趋势来体现,展示数据在整体趋势中的变动情况,常见时间维度的有近7日、近30日、本周、本月、本年等。
基本规则如下:
数据格式:当日日期+当日数据。
对比结果:论证某项数据在不同日期的表现,得出数据变动的趋势,包括上升趋势、下降趋势、波动趋势等。
例如,从老王的案例,我们通过趋势可以分析出店铺销售额数据7日的一个波动情况,了解这7日的整体销售状况。
老王淘宝店今日(12-16)销售额10000元,下表为近七日销售额。
老王淘宝店12-09~12-15销售额趋势图
和从前相同时期比
和从前相同时间的对比常用同比来体现,展示数据在相同单位周期内的对比,分析某项数据相对发展速度,常见的有周同比,月同比等。
基本规则如下:
数据格式:单日数据或某一时间段数据和。
公示:同比=(本单位周期数据-更大一个周期内的同一个单位周期数据)/更大一个周期内的同一个单位周期数据* 100%。例如12月和去年12月,12月第一周和11月第一周等。
对比结果:论证相同单位周期内的数据变化情况,常见的有同比增长、同比下降等。
例如,从老王的例子可以简单分析出2019年11月销售额和2018年11月销售额对比的变化,得出2019年11月销售额同比增长的结论,了解到11月销售额情况优于去年这一现象。
老王淘宝店今年11月的销售额为100000元,2018年11月的销售额为80000元,同比增长25%。
和前一个统计期比
和前一个统计期的对比常用环比来体现,展示数据在连续2个统计周期内的对比。分析某项数据逐级变动情况。
基本规则如下:
数据格式:单日数据或某一时间段数据和。
公示:环比=(本单位周期数据-上一个单位周期的数据)/上一个单位周期* 100%。例如12月和11月,12月第二周和12月第一周。
对比结果:论证本单位周期数据相较于上一个单位周期的数据变化情况,常见的有环比增长,环比下降等。
例如,从老王的例子可以简单分析出,2019年11月销售额和2019年10月销售额对比的变化,得出2019年11月销售额环比增长的结论,了解到11月销售额情况优于10月份这一现象。
老王淘宝店今年11月的销售额为100000元,今年10月销售额为80000元,环比增长25%。
和历史的特殊值比
和历史的特殊值对比常考虑到峰谷值和异常值的情况,一般用于异常数据的排查。
基本规则如下:
数据格式:当日日期+当日数据。
对比结果:当某项数据存在异常可能时,通过与历史特殊值的比较,排查是否真的存在异常情况。
例如,从老王的例子可以看出,今日数据销售额比平常大幅增长,存在异常的情况。但实际是因为今天是双十一,通过和历史上峰值的比较,就可以排除异常。
老王淘宝店今日销售额50000元,昨日销售额8000元,但是今日是11.11日。
与未来比,主要通过数据模型对历史数据的分析来预测未来的值。
数据预测需要谨慎使用,预测偏差易导致用户对我们产生不信任感和怀疑感,一般会通过一些模糊的概念来弱化用户对准确度的期待,例如经验数据,历史回测等。
同花顺某股票未来预测
不同个体的对比
在不同个体的对比上,往往会采用与自己比、与竞争对手比、与目标比、与行业数据比等对比方式。
与自己比
与自己比,通过内部的比较,分析内部不同个体之间的数据差异,为优化内部团队提供参考意义。
一般会考虑到不同个体对比和相同特征或属性对比。
1)在内部的不同个体对比
在内部的不同个体对比,考虑到相同时间内,不同个体之间同一个或多个数据字段的对比,一般用于了解不同个体之间的差异。
基本规则如下:
数据格式:相同日期+个体数据。
对比结果:论证不同个体在相同条件下数据的差异和区别,常用来对比分析不同个体的能力差异。
例如,从老王的例子可以发现,通过对两个客服的今日销售额数据比较,了解到客服团队中客服A的今日销售额高于客服B。
老王淘宝店的2个客服分别为客服A、客服B。
- 客服A今日销售额为5000元;
- 客服B今日销售额为3000元。
2)相同特征或属性对比
在内部的不同个体对比中,通过打标签等形式把相同特征或属性的个体进行分组归类,进行更细分的比较,挖掘组内共性和差别。
基本规则如下:
数据格式:相同日期+抽象标签+个体数据。
对比结果:论证相同特征或属性的个体在相同条件下数据的差异和区别,常用来对比分析相同特征个体的数据差异。
例如,从老王的例子,通过客服专员和客服助理的区分帮助我们有效的对客服团队进行了分类,客服专员本身在接待能力上就优于客服助理,客服A接待人数高于客服C的对比结果就显得意义不大,同类标签的不同客服对比更有意义。
老王淘宝店的3个客服分别为客服A、客服B、客服C。
- 客服A是客服专员,接待人数为100人;
- 客服B是客服专员,接待人数为120人;
- 客服C是客服助理,接待人数为30人。
与竞争对手比
与竞争对手对比,一般用于跟踪竞争对手的相关数据,了解对竞争对手的优劣势。
基本规则如下:
数据格式:相同日期+主体数据,相同日期+客体数据。
对比结果:论证相同条件下,某项数据相较于竞争对手存在的优劣势,常见的有优于,持平,劣于等。
例如,从老王的例子中,通过与竞争对手老李店铺的比较,简单得出12-15老王店铺的流量指数优于竞争对手老李的现象。
与目标对比
一般用于和设置目标进行比较,常用于绩效考核。
基本规则如下:
数据格式:相同日期+实际数据,相同日期+目标数据。
对比结果:论证相同条件下,某项数据相较于设置目标存在的差异,常见的有完成目标,未完成目标等。
例如,从老王的例子中,通过与目标销售额的对比,了解到12月客服团队销售额超额完成的现象
老王淘宝店铺2019年12月客服团队实际销售额103204,12月目标销售额100000,目标完成度:103%。
与行业数据对比
一般用于和行业数据进行对比,常用于通过和行业优秀或平均水平对比来发现自己所处的位置。
基本规则如下:
数据格式:相同日期+主体数据,相同日期+经验数据。
对比结果:论证相同条件下,某项数据相较于行业数据存在的差异,常见的有行业平均数据,行业优秀数据。
例如,从老王的例子中,通过与生意参谋中的行业数据的对比,了解到店铺处于女装行业第二层级,对自己店铺在整个女装市场有了一个简单的了解。
老王淘宝店铺2019年12月15日销售额为10000元,位于女装行业第二层级。
最后,对比数据也是具有迷惑性的,存在陷阱的。
例如老王店铺的例子,简单一看今日“静默销售额占比店铺总销售”的数据比昨日更多,容易产生今日静默销售额更多的误判。但因为销售额数据的不同,实际上两天的静默销售额是一致的。
今日静默销售额占比全店销售额12%,今日销售额100万,今日静默销售额12万;
昨日静默销售额占比全店销售额10%,昨日销售额120万,昨日静默销售额12万。
总结
数据对比是常见的一种挖掘规律的数据分析方法,其优势在于可以通过对比发现不同字段、不同个体之间存在的关系。
但同时需要注意的是,数据对比的同时需要考虑全局和业务,纯粹的数据对比也具有迷惑性,容易产生误判。