本篇文章主要介绍埋点的基本概念、操作流程,目的是能让大家对数据埋点有个基本的认识。
一、引言
动漫《海贼王》中,曾经拥有世界上一切的男人,海贼王哥尔·D·罗杰,在临行前说:“想要我的财宝吗,去找吧,我把世界上的一切都放在那里了”。全世界的人们都趋之若鹜奔向大海,寻找one piece,大海贼时代由此开启!17岁的路飞也遵循了与香克斯的约定,出海航行,立志成为海贼王。
而在2012年初,世界经济论坛发布的大数据和大影响报告指出,大数据已成为黄金和货币等经济资产。在未来,数据将成为商业竞争最重要的资源,谁能更好的使用了大数据,谁将领导下一代商业潮流,大数据时代已经到来!
期待你与奇数/草帽小子做一个约定,探寻神奇数据中的one piece,成为数据产品大牛。
二、数据生命周期
想要成为数据产品大牛,对数据就要了如指掌,那我们先来认识一下数据的人生之路吧。数据生命周期包含四个阶段:数据采集、数据预处理、数据挖掘/分析、数据应用。
从数据的产生到最后应用,存在着许许多多的知识与技巧,本文主要介绍数据产生的方式之一:数据采集中的数据埋点。
埋点数据作为可以记录用户行为的数据,在商业经营中能帮助企业快速定位分析用户群体,实现更好的企业效益,就像是路飞的二档技能,帮助他在航行过程中乘风破浪。像草帽小子一样,开启你的二档技能吧!
(1)数据采集:尽可能细而全的收集初始数据,便于后期进行数据分析与应用
- 埋点行为数据:通过埋点的方式,采集到的一些行为数据,如浏览、点击、停留时长等;
- 业务数据:伴随着业务产生的数据,核心是生产系统内存储的业务表单数据;
- 日志数据:一般是web端日志记录的数据;
- 外部接入数据:从第三方获得的数据。
(2)数据预处理:对一些不符合标准的数据进行清洗、转换,得到标准数据
(3)数据挖掘/分析:对预处理后的标准数据进行统计学分析,得到数据特性或普适规律
(4)数据应用:将数据特性或规律应用于业务,赋予数据业务价值
三、数据埋点
1. 常见问题
在了解完埋点在数据生命周期里扮演的角色之后,我们开始探讨埋点的滴滴点点吧。在做埋点的过程中,大部分人通常会遇到以下问题:
- 不知道埋点的全生命周期是怎样的,只有片段概念?
- 如何将业务需求转换为数据需求?
- 埋点文档怎么写?事件、参数是什么?
- 埋点管理如何进行,管理平台如何搭建?
- 埋点数据如何进行可视化展现?
- 埋点数据准确性如何保障?
下面我们先来了解一下埋点的基本概念与生命周期,其他的问题将在后续几期的文章中逐一解答,本文不再详细说明。
2. 埋点概念
数据埋点是数据采集的一种重要方式,主要用来记录终端用户的操作行为,后续用于进一步优化产品以及给运营提供数据支撑。
接下来介绍埋点的三种方式:
(1)全埋点
通过加载一段定义好的SDK代码,前端会自动全量采集全部事件并上报埋点数据,能够呈现用户行为的每一次点击、每一次跳转、每一次登录等全量、实时用户行为数据。
- 优势:简单、快捷;开发工作量少;
- 劣势:数据维度单一(如点击、加载、刷新);数据准确性不高;上传数据多,消耗服务器资源多;
- 适用场景:运营阶段初期,产品功能相对简单,主要分析活动页、着陆页、关键页面设计体验。
2010年,百度MP3 团队做了一个叫作Click Monkey 的产品,只要页面上嵌入SDK,就可以采集页面上所有的点击行为,并可以绘制出用户点击的热力图,这种方式对于一些探索式的调研还是非常有用的。
到2013 年,国外一家数据分析公司Heap Analytics,将这种方式更近一步,将APP 的用户行为尽可能地全面采集,然后通过界面配置的方式对关键行为进行定义,这样便完成了所谓的“无埋点”的数据采集。
(2)代码埋点
纯手动写代码,调用埋点SDK的函数,在需要埋点的业务逻辑功能位置调用接口上报埋点数据,让使用者可以方便地设置自定义属性、自定义事件。
- 优势:按需采集、对数据分析更精细化,数据采集能力较强,包含服务器、数据库、第三方数据;
- 劣势:项目工程量大,开发成本及沟通成本高;
- 适用场景:运营阶段中后期,追求精细化运营,需要进行多维数据分析。
在Google Analytics 年代,就已出现代码埋点。目前,国内的主要第三方数据分析服务商,如百度统计、友盟、TalkingData等都提供了这一方案。
(3)可视化埋点
产品及运营可在可视化界面上圈选定义事件,来追踪用户行为,相比于手动埋点更新困难,埋点成本高的问题,可视化埋点优化了移动运营中数据采集的流程,能够支持产品运营随时调整埋点,无需再走发版流程,直接把配置结果推入到前端,数据采集流程更简化,也更方便产品的迭代。
- 优势:开发工作量少,使用成本低;
- 劣势:数据精准度不高、针对页面上点击可见元素、数据维度单一(如点击);
- 适用场景:运营阶段初期,页面简单,主要分析点击事件。
国外比较早做可视化的是Mixpanel,国内较早支持可视化埋点的有TalkingData、诸葛IO,2017年腾讯的MTA也宣布支持可视化埋点。
3. 埋点生命周期
如同数据的产生与应用存在一个生命周期,埋点从需求提出到质量管理,也有一个完整的生命周期:
埋点的生命周期主要分为以下三个阶段:
(1)需求阶段:进行需求采集和需求分析,保证埋点满足核心业务需求
- 数据需求池:对数据需求进行整体维护,记录需求业务场景、需求内容、提出者、时间等
- 产品信息架构:梳理产品结构,熟悉产品
- 用户行为路径:分析用户路径,得到核心业务指标
(2)设计阶段:进行埋点版本规划和埋点设计
- 埋点版本规划:根据需求优先级,分版本上线,快速迭代;
- 埋点文档:详细描写版本记录、数据流程图、埋点事件等内容;
- 后台原型设计:埋点管理后台、数据可视化平台原型。
(3)质量管理阶段:保障埋点数据的准确及有效
- 数据准确性验证:埋点数据的准确性需要及时得到验证,以保证后续数据质量;
- 数据监控:定期监控埋点数据的产生情况;
- 埋点下线:没有价值、不符合当前需求的埋点进行下线。
四、总结
本篇文章主要介绍埋点的基本概念、操作流程,目的是能让大家对数据埋点有个基本的认识。埋点学习就像路飞打CP9,需要在实战去训练,才能在最后战胜CP9首领路奇。而在这个实战的过程中,路飞的身价从一亿贝利涨到了三亿贝利,相信你也能在学习的过程中,像草帽小子一样身价翻番。
作者:草帽小子;公众号:一个数据人的自留地,wx:luckily304