编辑导语:大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,从目前大数据发展的趋势来看,它不仅会成为一个蓬勃发展的行业,在其他行业的应用也有非常广阔的空间。本文作者就提出了用大数据赋能产品的想法,从而更好的进行用户特征分析。
一、为什么要进行用户特征分析
身边的产品越来越多:短视频抖音霸榜、社交微信巨头、电商京东拼多多淘宝分庭抗礼。
每一种的产品背后其实都有不同的用户群体,怎么去做获客?怎么去做增长?
我们需要了解用户,需要读懂用户,首先我们要对用户进行特征分析,总的来说用户特征分析有三种应用场景:
1. 寻找目标用户是产品存在的开始
首先是寻找目标用户,拿抖音为例:
抖音刚开始上线以后,很重要的一点就是要去分析我们的用户是谁,比如是什么样的年龄 性别 地域 学历等等。这可以很快帮助产品去发现现在的主流的用户群体是不是产品最开始的定位,如果完全不一样了,那就是产品哪里的设计有问题,偏离了方向。
等上线一段时间,我们就可以对用户进行不同活跃的等级的划分;比如同样都是玩抖音,有天天玩的也有偶尔玩的,有一次可以刷很久的,也有刷刷就走了的用户,频次、时长成了用户这时候最大的特征差异。
那么不同频次、不同时长的用户,他们的年龄、性别、地域有什么差异?这些都是特征的进一步洞察。
再过一段时间,有用户留存有用户流失,需要去分析留存和流失的用户在行为特征上的差异是否有什么特别不一样的。
2. 运营抓手离不开用户特征
除了寻找目标用户,当我们分析出了我们的主流用户的特征以后,比如18-24岁的3线城市,我们就可以对这一部分群体进行拉新,提高我们的新增用户;
当我们发现我们的活跃的用户,都是在最开始刷的五分钟内收藏了至少一次,那么我们就可以针对这些收藏的视频的特点,通过运营的方式给用户挑选跟这些视频类似的视频进行人工运营;
当我们需要通过运营的手段对流失的用户进行干预的话,我们就需要知道比如我们流失的用户是因为流失之前看的视频数少、视频时长小,那就可以通过运营活跃比如看视频领红包,这也是微视的打法。
3. 用户分层和用户特征息息相关
就像生活中人有长相、性格、学历、财富的差别一样,同样都是用抖音的用户,他们肯定拥有不同的粉丝数、不同的点赞数、不同的评论、不同的观看的时长偏好。那么对于每一类群体,我们都需要去告诉产品每一种的类别的占比。
同样的,都是在抖音上变现的用户,也会有变现的频次和变现的收入水平的差异。只有对这些的用户进行收入相关的特征分析,才可以对每一种用户群体的到底有多少给出回答。
我想抖音应该不需要有很强的马太效应,最好的是短视频时代,人人都可以变现。
二、用户特征分析的方法
1. 用户画像分析法
用户画像一般按业务属性划分多个类别模块:除了常见的人口统计、社会属性外,还有用户消费画像、用户行为画像,用户兴趣画像等。
人口属性和行为特征是大部分互联网公司做用户画像时会包含:人口属性主要指用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、生育情况、工作所在的行业和职业等。
行为特征主要包含:活跃度、忠诚度等指标。
1)以内容为主的媒体或阅读类网站、搜索引擎或通用导航类网站,往往会提取用户对浏览内容的兴趣特征
比如:体育类、娱乐类、美食类、理财类、旅游类、房产类、汽车类等等。
2)社交网站的用户画像也会提取用户的社交网络
从中可以发现关系紧密的用户群和在社群中起到意见领袖作用的明星节点。
3)电商购物网站的用户画像,一般会提取用户的网购兴趣和消费能力等指标
网购兴趣主要指用户在网购时的类目偏好,比如服饰类、箱包类、居家类、母婴类、洗护类、饮食类等。
消费能力指用户的购买力,如果做得足够细致,可以把用户的实际消费水平和在每个类目的心理消费水平区分开,分别建立特征纬度。
4)像金融领域还会有风险画像,包括征信、违约、洗钱、还款能力、保险黑名单等
另外还可以加上用户的环境属性,比如当前时间、访问地点LBS特征、当地天气、节假日情况等。
当然,对于特定的网站或App,肯定又有特殊关注的用户维度,就需要把这些维度做到更加细化,从而能给用户提供更精准的个性化服务和内容。
2. 聚类的方法
这个就是通过kmeans 聚类的方法对用户的行为进行聚类。
比如针对用户在淘宝上买东西的频次、价格、刷淘宝的时长,可以进行聚类分析,就可以将淘宝的用户划分为以下五种用户,然后再对这五种用户进行年龄和爱好等特征分析:
3. 监督模型
特征分析中还会使用像决策树这样的容易解释的监督模型,为什么是决策树?
举个例子:
假如我们有一个用户流失分析的目标为:根据用户近35天访问行为包括用户访问次数、访问天数、访问时长等,预测有流失倾向的用户。
另外,用户下单、付费等消费行为可做为用户对平台忠诚度的重要参考指标。建立有流失和非流失用户构成的建模样本,并对流失和非流失用户分别打上‘1’和‘0’标签。
根据模型可知:在一个流失周期内,用户的访问时长小于等于50.5,访问页面数小于等于20.5,并且付费金额小于70.5;那么此用户有流失的风险,也就是刻画出了流失用户的特征。