期刊信息
曾用名:现代图书情报技术;计算机与图书馆
主办:中国科学院文献情报中心
主管:中国科学院
ISSN:2096-3467
CN:10-1478/G2
语言:中文
周期:月刊
影响因子:0.912234
数据库收录:
北大核心期刊(2004版);北大核心期刊(2008版);北大核心期刊(2011版);北大核心期刊(2017版);中国科学引文数据库(2017-2018);中国科学引文数据库(2019-2020);中文社会科学引文索引-来源(2017-2018);中文社会科学引文索引-来源(2019-2020);国家哲学社会科学学术期刊数据库;中国人文社科核心期刊;中国科技核心期刊;期刊分类:图书情报与数字图书馆
期刊热词:
研究论文
数据分析中的万能宝典——帕累托最优解,你还
【作者】网站采编
【关键词】
【摘要】说起帕累托最优,估计没接触过数据分析的人都听过,但是怎么用帕累托模型解决实际业务问题呢?今天老李带你盘清帕累托最优的来龙去脉。 最近,做酒店管理的小李很头疼,酒店最
说起帕累托最优,估计没接触过数据分析的人都听过,但是怎么用帕累托模型解决实际业务问题呢?今天老李带你盘清帕累托最优的来龙去脉。
最近,做酒店管理的小李很头疼,酒店最近一个月的损失成本明显升高,但是一直却没办法改善,为什么会这样呢?
原来虽然这家酒店的人气火爆,每天都有客人预定房间,但最终总有一小部分人会取消预定,这些被取消的房间最终就会空下来,给酒店造成了很大的损失。
如果是你,你应该怎么解决这个问题呢?
什么是帕累托?
上面那个例子其实就是帕累托法则的最好体现,因为资源总是有限的,不同的渠道和用户会产生不同的效益,所以我们不能将所有的资源投入到全部渠道里,这就是帕累托法则所遵循的原则。
我们先看一下帕累托最优的定义:
帕累托分析依据的原理是20/80定律,80%的效益常常来自于20%的投入,而其他80%的投入却只产生了20%的效益,这说明,同样的投入在不同的地方会产生不同的效益。
什么意思呢?
首先我们举一个常见的例子:
一家人有A、B两兄弟,如果每个人分别去捕兔子,每个人每天都可以得到20斤食物;如果两兄弟合力去捕杀一只鹿,则可以得到100斤的食物;那么,那么如果你是这两个兄弟的父亲,你会怎么分配任务呢?
其实无非是三种分配方式:
两个人合力捕鹿:得到100斤食物;
两个人分别捕兔:得到40斤食物;
A捕鹿、B捕兔:A不得到食物,B得到20斤食物
A捕兔、B捕鹿:A得到20斤食物,B不得到食物
想都不用想我们都会让两兄弟合力捕捉鹿,这就是帕累托模型的本质,也就是资源集中,我们要把资源投放到效益最高的渠道中,也就是“头部”渠道,而不应该将资源投放到剩下的“尾部”渠道中。
帕累托怎么操作?
我们换到一个实际的例子看一下:
某集团公司下属有十余种业务或产品,但是最近发现公司的营销成本很大,想要缩减一些业务,或者调整一下业务的投入成本。这就是典型的业务升级(资源分配)问题。
帕累托图的绘制过程非常简单,就是按照贡献度从高到低依次排列,并绘制累积贡献度曲线,当样本数量足够大时,贡献度通常会呈现20/80分布。
这里面最大的难点就是如何表示某类产品的累积贡献度呢?
直接用每个产品的销售额比上总销售额?这显然是不可以的!所以我们要用到一个新的指标:累积销售额占比。
直接给大家演示一遍:
首先我们在finebi中从数据源开始上手,这是张销售明细表,其中包含每一笔销售订单的地区信息、商品的类别信息。
首先基于该表,我们使用FineBI中的计算指标功能,进行数据的处理加工分析,先可以简单地写一个计算指标,求销售金额合计,将销售额按照商品进行汇总。
然后我们想要计算累计销售额占比,首先就要计算出累计销售额,其公式为:累计销售额占比=累计销售额/总销售额。
我们先计算累计销售额,这里我们只需要在FineBI当中新建一列,选择“累计值/组内”,也就是按照从低到高计算累计值。
然后我们再算出总销售额,我们再选择新建一列,点击“所有值/组内”,直接计算出所有销售额的总和。
最后,我们根据公式计算出累计销售额占比,这里我们新建一列,将已经计算出的累计销售额和总销售额拖入进去,将字段类型设置为数值,即可得到占比。
这时候我们就可以绘制帕累托图了,选择新建可视化组件,然后将【子品类】字段拖动到横轴,【总销售额】拖动纵轴,再按照由大到小降序排列。
然后我们同样地将【累计销售额占比】字段拖入到纵轴,然后将其设置为折线类型,这时候基本的帕累托图就完成了。
文章来源:《数据分析与知识发现》 网址: http://www.sjfxyzsfx.cn/zonghexinwen/2021/0209/586.html