期刊信息
曾用名:现代图书情报技术;计算机与图书馆
主办:中国科学院文献情报中心
主管:中国科学院
ISSN:2096-3467
CN:10-1478/G2
语言:中文
周期:月刊
影响因子:0.912234
数据库收录:
北大核心期刊(2004版);北大核心期刊(2008版);北大核心期刊(2011版);北大核心期刊(2017版);中国科学引文数据库(2017-2018);中国科学引文数据库(2019-2020);中文社会科学引文索引-来源(2017-2018);中文社会科学引文索引-来源(2019-2020);国家哲学社会科学学术期刊数据库;中国人文社科核心期刊;中国科技核心期刊;期刊分类:图书情报与数字图书馆
期刊热词:
研究论文
数据分析方法:RFM模型
【作者】网站采编
【关键词】
【摘要】编辑导语:RFM是很传统的数据分析模型,几乎所有文章都会提到它,然而市面上流传的各种乱用、错用也非常多;本文作者对RMF做出了详细的分析,我们一起来了解一下。 上一篇讲了【
编辑导语:RFM是很传统的数据分析模型,几乎所有文章都会提到它,然而市面上流传的各种乱用、错用也非常多;本文作者对RMF做出了详细的分析,我们一起来了解一下。
上一篇讲了【用户画像高大上,但90%的人都做失败了】以后,很多同学表示想看RFM,今天它来了。
一、RFM基本原理
RFM是三个单词的缩写:
最近一次消费时间(Recency),取数的时候一般取最近一次消费记录到当前时间的间隔,比如7天、30天、90天未到店消费;直观上,一个用户太久不到店消费,肯定是有问题,得做点什么事情,很多公司的用户唤醒机制都是基于这个制定的。
一定时间内消费频率(Frequency),取数时,一般是取一个时间段内用户消费频率。比如一年内有多少个月消费,一个月内有多少天到店等等;直观上,用户消费频率越高越忠诚;很多公司的用户激励机制都是基于这个制定的,买了一次还想让人家买第二次。
一定时间内累计消费金额(Monetary),取数时,一般是取一个时间段内用户消费金额,比如一年内有多少消费金额;直观上,用户买的越多价值就越大;很多公司的VIP机制是基于这个指定的,满银卡,满金卡一类。
所以,即使单独看这三个维度,都是很有意义的。
当然,也有把三个维度交叉起来看的(如下图):
因为RFM与时间有关,因此很多同学在取数的时候会纠结时间怎么分;严格来说,越柴米油盐,消费频次本身越高的业务,取的时间应该越短。
最典型的就是生鲜,人天天都要吃饭,7天不吃可能就有问题;普通的快消品零售可能取30天,类似服装百货零售可能取90天;当然,更多的做法是按月取,比如R按月取,F、M算最近一年内的数值——这样做单纯是因为比较方便理解而已。
RFM本质上是一种用三个分类维度,找判断标准方法;通过三个维度的组合计算,能判定出用户的好坏,然后采取对应措施。
RFM的真正意义在于:这是一种从交易数据反推用户价值的方法,因此可行性非常高!
要知道:做数据分析的最大瓶颈是数据采集,而只要是个正常企业,交易数据是肯定有的;因此只要企业建立了用户ID统一认证机制,就能将用户ID与交易数据关联起来,就能用RFM来分析用户了;即使没有埋点、没有网站、没有基础信息也能做,简直是方便好用的神器。
当然,所有方便好用的工具,都自带一些不足,RFM模型也是如此。
二、RFM的最大短板
RFM最大的短板,在于用户ID统一认证;不要小看这几个字,在相当多的企业里非常难实现。
比如你去超市、连锁店、门店买东西,往往收银小妹会机械的问一句:有会员卡吗?如果回答没有,她也放你过去了;导致的结果,是线下门店的订单,一般有70%-90%无法关联到用户ID;进而导致整个用户数据是严重缺失的,直接套RFM很容易误判用户行为。
至于用户一人多张会员卡轮流薅羊毛,多个用户共同一张VIP卡拿最大折扣,店员自己用亲戚的卡把无ID订单的羊毛给薅了之类的事,更是层出不穷;而且在实体企业、互联网企业都普遍存在。
所以做RFM模型的时候,如果你真看到111类用户,别高兴太早,十有八九是有问题的;现在的企业往往在天猫、京东、自有微商城、有赞等几个平台同时运作,更加大了统一认证的难度;如果没有规划好,很容易陷入无穷无尽的补贴大坑。
三、RFM的深层问题
即使做好了用户ID统一认证,RFM还有一个更深层的问题。
让我们回顾一下,RFM模型的三个基本假设:
- R:用户离得越久就越有流失风险
- F:用户频次越高越忠诚
- M:用户买的越多越有价值
反问一句:这三个假设成立吗?
如果不结合具体行业、具体产品、具体活动来看,似乎是成立的;但是一旦具体讨论就会发现:很多场景不满足这三个假设;因此:单纯讲RFM,不结合产品、活动,是很容易出BUG的。
R:用户离得越久就越有流失风险
- 如果是服装这种季节性消费,用户间隔2-3个月是很正常;
- 如果是手机、平板这种新品驱动产品,间隔时间基本跟着产品更新周期走;
- 如果是家居、住房、汽车这种大件耐用品,R就没啥意义,用户一辈子就买2次;
文章来源:《数据分析与知识发现》 网址: http://www.sjfxyzsfx.cn/zonghexinwen/2020/1010/344.html