电商销售数据分析案例(Oracle)

如题所述

第1个回答  2022-07-10

数据来源于Kaggle的电商数据集 The UCI Machine Learning Repository ,英国在线零售商在2010年12月1日到2011年12月9日的在线销售数据,该电商公司主要以销售各类礼品为主,多数客户都是批发商。

使用Oracle 对数据进行处理与清洗,通过RFM模型、复购率、消费生命周期等对用户维度进行分析,利用ABC分类、退货率等维度展开剖析,结合Excel图表进行可视化展示,为精准营销与个性化服务提供支持。

根据分析目的选择字段,数据集共8个字段,如果表格字段较多,视情根据分析目的的需要选择合适的字段。

创建备用表new_ecommerce,将旧表的数据去重添加进备用表。原有数据541909条, 去重后数据536641条,删除重复值5268条。

检查缺失值

CustomerID存在缺失值135037条,Description出现缺失值1454条。数据都很大,不可能全部删除。Description产品描述不是项目分析,不用处理。

在实际工作中,像CustomerID客户ID缺失,首先找业务部门或者数据来源部门确认信息并且补上。本项目只有单一数据,无法找到相关人员确认,暂且把NULL值替换为0。

5.1检查日期是否在范围内(2010年12月1日到2011年12月9日)

交易成功,销量不可能为负值或零值。如果销量为零或者负值情况,那么需要和业务/数据来源部门确认具体的原因。这里假设出现负值是客户退货情况。

检查发现交易销量小于0的发票编号大都是"C”开头的,有部分异常销量小于0但不是以"C"开头,这里做删除处理。

检查发现有单价为0的免费单,共计1174。暂且不分析免费单,直接删除免费单的数据。

检查发现两笔坏账,单价都是负值,故把它删除。

根据分析目的,我们处理InvoiceDate日期数据。这里只做日期分析,不分析小时分钟,故转换为日期格式。

根据分析目的,本次分析将采用RFM模型
在RFM模式中:
R:最近一次消费时间(最近一次消费到参考时间的间隔)
F:消费的频率(消费了多少次)
M:消费的金额 (总消费金额)
一般的分析型RFM强调以客户的行为来区分客户。

根据最近一次消费与客户数的分析结果显示最长的天数差是373天,最短0天;80%的客户在200天内都有交易记录,说明客户忠诚度不错。

分析显示,10次交易记录以内的客户占绝大部分,说明客户是很认可产品和服务。

在2010年12月1日到2011年12月9日期间,交易金额主要集中在 1000英镑以内和1000-3000英镑这两个范围内。

分析发现,该电商平台总交易客户数4372位。交易客户中,一般发展客户(可以说是新客户)最多,占总数的34%,其次是一般挽留客户(流失客户)29%,重要发展客户22%,重要价值客户10%,重要挽留客户5%和重要挽回客户0.16%。

每月新客数量及其占比

每月的新老客户的销售数量与销售金额

用户生命周期 = 最近一次购买时间 - 第一次购买时间

商品退货分析

结合ABC分类进行分析,选取退货率大于均值且为A级的商品(主要是综合上文提及的ABC分类和退货率计算,通过创建view的形式进行联结后筛选,创建退货率视图为view_return_rate,ABC分类视图为view_class),这里筛选出64个商品。

相似回答
大家正在搜