系统场景的离线评估指标,你知道多少?

编辑导读:像搜索推荐这种策略性产品,离线评估是一项必须要做的事情。通过离线评估的方法,发现当前策略中存在的问题点,对于优先级比较高的问题以需求和项目的方式推荐,这是策略产品经理主要工作之一。本文作者推荐了几种系统场景的离线评估指标,与你分享。

系统场景的离线评估指标,你知道多少?

像搜索推荐这种策略性产品,离线评估是一项必须要做的事情。通过离线评估的方法,发现当前策略中存在的问题点,对于优先级比较高的问题以需求和项目的方式推荐,这是策略产品经理主要工作之一。

今天主要聊聊对于推荐系统的常见离线评估指标。

在之前的文章当中,我不止一次提到过策略是业务的策略,撇开业务谈策略都是耍流氓,因此对于推荐策略的评估也需要区分不同的业务场景。

01 内容类场景

内容是一种比较常见的推荐结果形式,我们常说的内容不仅仅是指文字,还包括像音频,短视频,直播等新型的内容形态。

除了像今日头条,抖音,腾讯新闻这类应用存在大量的内容推荐策略,其实诸如淘宝,京东等电商业务也有很多的内容个性化应用。最新改版的淘宝,首页推荐feed流里面就包含了大量的内容推荐结果,而且还把“逛逛”内容社区搬到了第二个TAB上。无一例外,这些内容的背后都是无数个性化内容推荐策略运作的结果。

一般我们在评估类似这种内容场景下的推荐策略的时候,相比转化,我们更注重用户对内容信息的消费效率。因此对于这类型场景下的推荐效果我们更应该采用信息维度的指标去进行评估。通常包括如下几个:

  • 点击数:内容被点击的人数和次数
  • CTR:内容的曝光点击率
  • 停留时长:用户在内容feed,内容详情页的停留时长
  • 阅读深度:用户对内容的浏览层级,通常通过单次浏览页面的个数来衡量

上面这些指标通常是对内容类推荐场景下的策略效果进行离线评估使用的指标。

02 交易类场景

交易类场景则比较好理解,典型的比如淘宝,京东首页的猜你喜欢,为你推荐中的商品feed。因为推荐的结果就是商品,所以此时推荐系统的目标就是让用户在该商品上进行下单,转化。

很明显的一个流程就是:商品推荐位-商品列表页/详情页-购物车-提交订单页-支付完成页。

相比内容类场景下,推荐系统注重对内容信息的消费效率,在交易类场景下,推荐系统则更关注用户在此场景下产生的订单量,订单金额。

所以对这类场景下推荐策略效果进行离线评估时,常用的指标有:

  • 订单量:由对应推荐位带来的订单量
  • 订单金额:由对应推荐位带来的订单金额
  • CVR:订单转化率
  • 支付率:从提单到支付的完成率
  • 加车率:从商品详情页到购物车的转化率

交易类场景上面五个是比较通用的。

03 体验类场景

最后一个则无论是在内容信息,还是在交易成交类场景下都需要关注的:体验类场景。

相比上面的两大场景,我们可以用客观的数据来进行衡量,体验类场景则略带主观。

因此在进行综合评估之前,通常需要认为制定一套团队公认的评估标准,以指导体验场景下对推荐策略好坏的评估。

虽然需要人为制定评估标准去规范整个评估的流程,但并不是说体验类场景没有对应的评估指标。下面几个是常见的几个指标:

  • 主动负反馈率:用户主动反馈不感兴趣的比率
  • 品类多样性:衡量推荐结果的丰富度
  • 用户满意度:通过case评测的方法来综合评定策略的满意度

以上三类就是对推荐策略常见的三种离线评估指标,还是那句话撇开业务谈策略是耍流氓,同样对于不同场景下的推荐结果的评估也需要制定不同的评估标准和指标。

作者

夏唬人,微信公众号:夏唬人,2019年年度作者。《策略产品经理:数据赋能业务》作者。某厂策略产品经理,关注推荐、搜索、AI策略方向。

 

特别申明:本站的主旨在于收集互联网运营相关的干货知识,给运营小伙伴提供便利。网站所收集到的公开内容均来自于互联网或用户投稿,并不代表本站认同其观点,也不对网站内容的真实性负责,如有侵权,请联系站长删除,转载请注明出处:系统场景的离线评估指标,你知道多少?:https://www.zcly.cn/72397.html。
(0)
夏唬人的头像夏唬人专栏作家
上一篇 2020年12月30日 19:30
下一篇 2020年12月30日 23:35

猜你喜欢

发表回复

登录后才能评论

QQ:1124602020
微信:vl54120
备注:周一至周五全天在线,周末可能不在线,另外联系时,请告知来意。

公众号
交流群
运营狗会员,开通可享海量资源与多项权益,点击了解详情