啤酒与尿布---神奇的购物篮分析

老高的购物篮分析

公告

“啤酒与尿布”是一个真实的故事,发生在1990年代的沃尔玛大卖场,代表卖场的购物篮商品之间存在着某种特定的关联关系,挖掘并利用这种关联关系,可以使得实体零售门店充分;了解顾客的购物场景,为选品与品类管理、定价与调价、促销策略及评估、关联陈列、顾客行为聚类等提供了有效的数据依据。

我在2008年撰写了《啤酒与尿布-神奇的购物篮分析》(清华大学出版),开辟本专栏,是为了与大家探讨实体门店购物篮管理的理念、计算方法及案例,以及能够与相关软件企业合作,开发相关应用软件产品

MP:13901022781 微信同号

统计

今日访问:143

总访问量:223886

序列关联以及在零售业的应用(二)

2023年12月13日

评论数(0)
三、序列关联模式的数据源、处理方式及算法思路
零售序列关联分析的数据源依然是购物篮数据,在进行序列关联分析时,需要对购物篮数据进行如下处理:
1、简单序列的购物篮数据处理:一般认为购物篮中商品排列顺序就是简单序列,而Apriori算法中的购物篮数据是有着严格的前后顺序,即所谓“前件(antecedent)”、“后件(consequent)”之分,这是因为关联关系具有方向性,比如购物篮{全脂牛奶、面包},将商品顺序颠倒过来,关联关系也会发生变化。
在进行购物篮分析时,需要明确商品的前后顺序,那么,可以按照销售小票中的商品顺序作为商品的序列吗?
答案是不能!购物篮分析的商品序列不能来自于POS产生的销售小票,即使销售小票中商品数据有前后时间戳也不行,因为交易小票的商品顺序来自于收银员拿起商品、进行条码扫描的顺序,这个顺序完全是随意的。
比如有一个购物篮数据,其商品序列为{啤酒,熟食,牛奶,厨房用品},这样的商品顺序完全是随机的,不能作为前件、后件区分的依据。
此时可以试试这种方法,即根据卖场的动线设计,比如卖场出入口、主通道、货架的区域分布,重新组织购物篮的序列数据。
我们假定有3个购物篮的商品构成为:
{啤酒、熟食、牛奶、厨房用品};
{牛奶、熟食};
{啤酒、熟食};
该卖场区域动线设计思路是,从大门口进来,经过主通道来的不同货架区域、最终到收银台,其动线设计思路顺序为:厨房用品->熟食->啤酒->牛奶;
因此可以将上述三个购物篮重新组合后的简单序列为:
{厨房用品、熟食、啤酒、牛奶};
{熟食、牛奶};
{熟食、啤酒};
经过重新组合的购物篮数据具有了简单序列模式,对应了顾客购物行为的序列模式,此时就可以采取Apriori进行序列关联规则数据挖掘。
2、严格时间序列的购物篮数据处理:当交易数据可以定位到单体顾客时,可以将顾客的购物篮数据转化为购买行为序列数据,购买行为数据具有时间属性,时间属性来自于订单形成时间,订单的时间属性可以直接继承给购物篮中的商品数据。
比如表4-5顾客购物篮数据

顾客ID
交易时间
购买商品列表
1
4/25/15:30
A
1
4/30/12:25
B
2
4/10/14:29
C,D
2
4/20/12:20
A
2
4/25/15:20
E,F,G
3
4/15/15:15
A,H,G
4
4/15/12:00
A
4
4/20/12:20
F,G
4
4/25/16:20
H
5
4/16/14:20
H

表4-5 顾客时间序列购买数据
整理后的顾客购买行为序列数据为表4-6:

顾客ID
购买序列
1
<(A),(B)>
2
<(C,D),(A),(E,F,G)>
3
<(A,H,G)>
4
<(A),(E,G),(H)>
5
<(H)>

表4-6 顾客购买序列数据
3、序列关联模式的分析方法
简单序列分析方法:
零售简单关联序列分析方法,与传统的购物篮分析基本一致,首先需要组织商品的购物篮序列数据,在给定的购物篮序列数据集合中,根据用户指定的最小阈值,找出大于或等于阈值的所有序列,以此挖掘商品序列关联模式。
比如下面的三个购物篮中,找出大于60%支持度的频繁模式:
{厨房用品、熟食、啤酒、牛奶};
{熟食、牛奶};
{熟食、啤酒};
我们可以看到,熟食=>啤酒、熟食=>牛奶的支持度都满足这个条件。
时间序列关联模式的挖掘方法:
在当今数据分析界,对于时间序列关联数据挖掘方法,基本思路依然是基于Apriori算法,即使交易数据具有时间属性,时间属性也只是用来对交易数据的前后排序,比如上述表4-5的顾客购买序列数据,寻找支持度在40%以上的序列模式,有如下的序列关联关系存在:(A),(H),(E,G);
四、时间序列分析与复购周期:
零售业存在着消费者的周期性购买行为(Purchasing Cycles),这种周期性行为是由商品品类的购买周期决定,每个品类的购买周期都不同,生鲜食品购买周期最短、其次是母婴用品、日用品、服装、家电商品等。
商品购买周期越短,对应的顾客复购率越高,反之顾客的复购率越低。
某超市研究发现,对于生鲜品类的购买频次,每个家庭每周大约是5.02次,但购买频次跟住户家的距离远近有关系,例如到稍微远一点的社区店购买频次,平均每周是3.61次。
零售业有个共识,要选择复购率低的商品加大品类布局、选择高复购率的商品进行促销。
商品的购买周期会体现为一种典型的时间序列模式,通过对顾客群体的购物篮商品序列进行分析,可以甄别消费者行为周期、找出消费者的复购规律,适时对顾客群体进行促销,从而达到提升复购率的目的。
对于特定顾客群体的购买行为序列分析,不能局限于单次购物,必须放在一个较长的周期内。
每个商品都会有相对稳定的购买周期,会表现为一定天数的时间间隔,对顾客手中购物篮进行较长周期的购买行为序列挖掘,可以找出这些商品的购买周期,根据这些购买周期,可以提前布局、在周期临近时组织商品促销。
即使是同一个商品,不同的包装规格会导致复购的周期不同,将商品的大包装改为小包装也是改变消费周期的方法,日本人早就发现,大包装的商品由于使用周期长、会导致复购率下降,而小包装商品会加速商品的复购周期,而小包装商品更容易形成关联购买。
在对消费者的购买时间序列进行分析时,会发现有不同购买周期的商品,这些商品在顾客的购物篮中存在着关联关系,对于具有关联关系的不同购买周期的商品,如何组织促销?
这个问题涉及了商品组合的购买周期,此时会选择短周期的商品作为促销品,这样可以提高顾客的复购率。
根据某些商品的购买周期,可以制定合适的促销策略,在欧美超市对食品类商品(比如鸡蛋、面包等),提前一周发放促销优惠卷,激励消费者到期购买此类商品,周期促销手段获得了很好的效果。
在零售门店中,果蔬类、肉类、水产、禽蛋是短周期商品,而调料、食用油的购买周期会稍长,而这些商品之间都存在着关联关系,常规做法是以短周期商品为引流产品、促使与长周期商品形成较高质量的购物篮。
在复购周期快到的时候,促销选品应该从关联商品(互补商品)中选择一个进行促销,如鸡蛋和蒸蛋器、啤酒和下酒菜,对于超期未复购的客户,通过精准营销系统(比如发放DM单等促销信息)进行复购引导;
组织促销时,可以结合商品关联表,对于具有相同购买周期的关联商品,可以选择其中的一个商品组织促销,比如,椰黄包与三全水饺的关联度很高,当三全水饺有活动时,则通知购买了椰黄包30天左右的顾客。
新品上市的时候,可以推荐处于类似商品复购周期的客户体验购买。
如何计算商品的复购周期?
商品的购买周期从顾客购买之日起算,至顾客下一次购买的时间差,对于特定顾客群体会按照平均值计算,表4-7为某超市的商品复购分析。

商品名称
所属品类
复购人数
复购次数
人均复购次数
平均复购天数
某尿片(男)XL号
尿片
315
717
2.28
20
某幼儿奶粉400g
奶粉
305
1104
3.62
15
某精制盐454g
调料
88823
208372
2.35
41
某乳酸菌饮料
乳制品
80815
328642
4.07
23
某烤香肠48g
肉制品
58927
146363
2.48
27

表4-7 某超市的商品复购行为分析


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+老高与购物篮分析。