2023年07月04日
评论数(0)在数据分析过程中,分类是非常重要的工具,它也是我们认知事物的基本方法。分类即把事物分开并归纳到不同的类别里面,让我们可以通过细分对事物建立更深刻的认识。
在数据分析中,分类可以帮助我们更好地组织和理解数据,并找到其中的关系和模式。例如,我们可以将用户分为不同的年龄组、性别和收入水平,以更好地了解他们的消费习惯,并制定更有针对性的营销策略。
在分类时首选需要选定分类对象。在使用分类方法做用户分析时,分类的对象就是我们的用户,是购买或者使用我们产品的人或者组织。
当我们要分析一个事物的时候,可以从这个事物的构成要素、属性特征、行为习惯3个角度来做分析。假设我们要做的是ToB行业的用户分析,那我们的分析对象就是一个个自然人。作为人来说,他的构成要素包括器官、系统、细胞这些生理组成部分。做生理检查的时候,就可以从人的这些构成要素一一检查。我们的目的是做商业分析,所以可以忽略用户的构成要素这一点,而从用户的属性特征和行为习惯两个角度去做分析。
事物的属性就是事物自身的特征或者特性。用户的常见属性包括区域、性别、年龄、职业、获客渠道等。
此外,用户在整个消费过程中产生的行为,包括访问和浏览行为、消费行为、搜索行为、反馈行为等,会产生诸如购买品类、消费金额、购买频率、购买周期、首次消费日期、最近消费日期等数据。我们也可以根据这些消费行为数据对用户做分类。
用户的属性数据本身就是一些描述性的文字或非连续性的数值,通常可以直接拿来作为用户的分类标签。但是用户消费行为数据通常是连续性数据,不能直接拿来作为分类标签使用。因此在使用用户消费行为度量做用户分类前,我们还需要进一步明确分类标准,度量值多大时用户分类为A类,多大时分类又是B类、C类。以电商行业为例,我们可以根据几个常用的用户消费行为度量设置用户分类标准:
在上述电商案例中,我们采用了手动分类的方法,人工设置了用户分类标准。在实际应用时,可以根据行业情况、数据特征、业务目标等调整分类标准。除此之外,我们也可以使用机器学习等技术进行自动分类。例如通过聚类算法,让机器把数据集中的样本按照特征进行分类。但无论采用哪种方式,分类标准应该是准确、可靠和可重复的。
下面我们看一下怎样在观远BI平台上对用户做分类,并使用用户分类标签做用户分析。
1、创建分类标签
1.1 选定分类标准
我们首选选择一个用户消费相关度量作为分类依据,再确定一个分类标准。例如:根据用户最近消费日期距离当前日期的长短,将用户分为流失用户和活跃用户。
? 流失用户:指在一段时间内没有使用过产品或服务的用户。
? 活跃用户:指在一段时间内有使用过产品或服务的用户。
? 时间间隔可以根据业务需求来设置,例如一个月、三个月或半年等。在以下示例案例中设置为三个月。
1.2 数据源:
? 去重到日期、用户级别的用户消费数据。在实际应用中可以添加用户属性相关信息,以便做更丰富的分析。
1.3 实现步骤:
① 数据源中包含日期、客户代码、销售额3个字段;
② 新建计算字段-统计日期 TO_DATE([DYNAMIC_PARAMS.日期])
③ 新建计算字段-最近消费日期MAX([日期])OVER(PARTITION BY [客户代码])
④ 新建计算字段-最近消费月数 MONTHS_BETWEEN([统计日期],[最近消费日期])
⑤ 新建计算字段-用户标签 IF([最近消费月数]>3,'流失','活跃')
2、使用分类标签
在根据所设置的分类标签对用户做了分类之后,我们就可以使用这些用户分类标签了。用户分类标签的使用方法包括:
① 使用用户分类标签,统计用户人数占比。例如下图中的活跃&流失用户人数占比;
② 使用用户分类标签+维度,统计用户人数占比。例如统计新老客占比月度趋势;
③ 使用用户分类标签,统计用户相关指标。例如统计高价值客户消费金额占比;
④ 使用用户分类标签+维度,统计用户相关指标。例如统计不同注册月份新用户的留存率月度趋势;
⑤ 将用户分类标签结合起来,做综合的用户价值/质量分析。
2.1 矩阵分析
我们选取两个分类标准作为两个变量,将它们分别放在一个二维坐标系的两个轴上,然后根据它们的取值将坐标系划分为四个象限,这就是四象限分析法。四象限分析法是一种常用的数据分析方法,它可以帮助我们更好地理解数据中的关系,从而做出更明智的决策。例如Eisenhower矩阵,可以帮助人们将任务按照重要性和紧急性进行分类,将任务分为重要且紧急、重要但不紧急、不重要但紧急、不重要且不紧急等四个象限,是我们非常熟悉的一个四象限分类。
以用户分析为例,我们可以使用【最近消费日期】和【购买频率】两个度量对用户做四象限分析:
根据这两个度量可以把用户分为四类:
? 重度活跃用户:最近一次消费在3个月以内,在最近一年内消费次数超过3次。是需要保持的最有价值的客户。
? 一般活跃用户:最近一次消费在3个月以内,但在最近一年内消费次数未超过3次。活跃的但是消费频率低的用户是潜力客户,需要通过营销策略提升消费频次。
? 重要流失用户:最近一次消费在3个月以上,但在最近一年内消费次数超过3次。曾经很活跃但现在流失的用户。需要调查分析流失原因,并通过营销策略重点激活和维护。
? 一般流失用户:最近一次消费在3个月以上,且在最近一年内消费次数不超过3次。可能是一次性消费的用户,可以进一步调查分析用户不活跃和流失的原因。
实现步骤:
① 新建计算字段-1年内 ADD_MONTHS([统计日期],-12)
② 新建计算字段-时间筛选 [日期]>=[1年内] AND [日期]<=[统计日期] ,字段类型为布尔型,并添加到筛选
③新建计算字段-消费次数 SIZE(COLLECT_SET([日期]) OVER (PARTITION BY [客户代码]))
④ 新建计算字段-用户标签2 IF([消费次数]>3,'高频','低频')
⑤ 新建计算字段-用户四象限类别
CASE WHEN [用户标签1]='流失' AND [用户标签2]='高频'THEN'重要流失用户'
WHEN [用户标签1]='流失'AND [用户标签2]='低频' THEN'一般流失用户'
WHEN [用户标签1]='活跃' AND [用户标签2]='高频' THEN '重度活跃用户'
WHEN [用户标签1]='活跃' AND [用户标签2]='低频'THEN '一般活跃用户'
END
2.2 三维分析
如果我们从三个角度来做用户分析,就可以形成一个三维魔方。RFM模型就是一个用来做用户分析的三维魔方。通过对客户最近一次购买时间(R)、购买频率(F)和消费金额(M)三个度量进行评估分类,可以将客户分为8类,从而就可以制定出更有针对性的营销策略。
根据三个度量可以把用户分为八类:
? 重度价值用户:R高F高M高,重要客户需要重点保持,提供优质服务;
? 重要发展客户:R高F低M高,需要着重提升用户购买频次;
? 重要保持客户:R低F高M高,加强客户联系,提醒客户消费;
? 重要挽留客户:R低F低M高,加大促销力度;
? 一般价值客户:R高F高M低,提升客单价;
? 一般发展客户:R高F低M低,提升新客户消费频次;
? 一般保持客户:R低F高M低,提醒消费;
? 一般挽留客户:R低F低M低,流失风险大,使用促销方式召回。
关于RFM的实现步骤,可以参考阅读数分实战派上一期的分享《构建RFM客户价值模型,实现精细化运营》,或者访问观远云应用市场上的相应案例。
在实际应用中,分类方法可以帮助我们更有深度的认知事物。通过分类方法做用户分析,将用户分为不同的类别,可以让我们更好地了解用户的需求和偏好,可以让我们更好地制定产品和营销策略,以满足不同群体的需求。
在使用分类方法时,我们应该注意:
① 分类标准的描述应该尽可能准确和全面,以确保分类结果的精确性和可靠性.
② 收集到的数据应该足够详细和全面,以确保分类结果的可靠性。