母婴市场数据分析

数据分析实战,电商数据分析

 

随着国家开放二孩政策,婴儿市场规模也在不断的扩大,根据淘宝天猫的婴儿用品购买情况,对产品进行多维度的分析,着重分析市场需求,定位市场方向,从而在满足市场需求的同时,提高销量。

 

1.理解数据

数据来源于阿里天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

包含两张表:商品表和婴儿表

购买商品表字段信息:用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期

婴儿信息表字段信息:用户ID 出生日期 性别

 

2.提出问题

相关指标

 

提出问题

1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?

2.哪些商品最热销,可主推?

3.用户年龄段、性别对于销量的影响?如何做到精准营销?

分析思路

 

 

 3.数据清洗

选择子集

考虑到属性字段,都是一些编号,没办法具体分析,因此去除该字段

列重命名 把英文改成中文

一致化处理

两张表都需要对日期进行处理,转换成标准的日期格式,text函数进行格式化统一,也可以用分列进行

数据整合

使用sql 语句,制作 baby——product 和 product_baby表格

异常值处理

关于婴儿性别,0代表女,1代表男,2代表未知,要对2的异常数据进行处理,这里按照男女比例大概处理,男女比例为438:489.总共26个异常值,因此把12个替换成1,14个替换成0

4 数据分析

1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?

- 首先,对销量进行多维度拆解,分成新用户购买量 和老用户购买量,分别进行分析,但是经过计算,该测试数据,老用户复购率特别低,因此可以忽略,直接从新用户购买数量,在时间维度上进行分析。

下图是商品的总体走势

 

 

 

接下来我们看看每年的每个月的走势对比

 

通过走势分析发现,在每年的5月,9月,11月都有不同程度的高峰凸起,整体呈现上涨趋势,接下来分析为什么销量上涨

 

 

2,这里可以采用4P营销理论,利用假设检验法,分别从产品、价格、渠道、宣传,四个方面进行分析

 

 

 产品维度

假设:新增产品类带来销量的上升

收集证据:下面是各年各月的二级分类商品数量对比

 

 

 可以看出,2014年在5月,11月商品数目有所增加,2013年和2012年有所缓慢的上升趋势,但是由于这个是订单数据,这些商品也只是获取的购买到的商品数量

所以不太准确,建议可以根据公司实际市场部的商品数据进行二次验证,因此假设检验表不成立。

       价格维度

假设:降价带来的销量上涨

收集证据:

由于案例中没有涉及到价格相关数据,因此假定平均价格保持稳定,对销量影响不大,因此假设不成立。

  渠道维度

假设:新增渠道带来销量上涨

收集数据:

根据每个月的走势图,我们发现,仅仅是在5,9,11存在波峰,之后前后月份都会 有所下降,所以如果是渠道增加,应该是一个持续上涨的趋势,所以推断假设不成立,案例中没有相关数据,实际工作中,可获取渠道数据进行验证,

所以在本案中,假设不成立。

  宣传维度

宣传维度主要包括品牌宣传,公关,促销等,这里只分析促销

假设:由于促销活动带来销量上涨

收集证据:

先看5月数据

 

 

从图中可以看出2014年在5月3日,5月12日,5月22日都有明显的波动,特别是在5月22日,核证后,5月1日-5月3日(劳动节)、5月11日(母亲节)一节5月20日(表白节)

淘宝天猫均做促销,13年5月数据在5月3号,5月10号和5月20号也都有所上涨,说明受到节日促销的可能性很大。

接下来再看9月数据


 

 

 

 

 

 

 

 

 

 2014年9月20日达到一个很大的波峰,2012年和2013年也有不同程度的波峰,考虑到每年的9月都会有中秋的节日,可能会不定期搞促销活动,但是

9月20日并没有什么节假日或者活动日,经核查,有一笔订单,一次性订购了2748件,属于偶然事件,不作为分析范围。

 

再来看11月数据

 

 

 

 

 

 

 这个就很明显啦,双十一活动带来的影响,只是时间是在11月13日,不是11月11日。这个需要跟相关部门沟通一下,是不是促销时间调整的问题。

2012年在11月10日和11月19日出现高峰,2013年11月11日和11月29 日出现高峰,2014年是11月13日出现高峰,很明显是双十一带来的影响。

因此促销活动带动销量的假设成立。

 

总结: 促销销量增长的原因,一是促销活动带来非常好的效果,而是商品数量的增加也在一定程度上促进了销量增长,但是对于产品促销,在实际工作中,还需要进一步考虑

成本问题,对于ROI的把控,一味的促销是不可取的。

 

2.如何进行有效的促销?

 

可以从以下两个方面

 

  主推热销产品

热销产品,这边定义为下单次数多的商品,如果从订单量考虑的话,会出现一次性购买很多的现象,下单次数多,代表大家对该产品都喜爱,这才是热销。

 

 

 

 

 从图中可以看出,68结尾的商品,订单量是最大的,但是销量低于28产品,按照我们对于热销产品的定义,50008168为热销产品,这是商品一级分类,接下来分析该

商品类下的二级分类订单量情况。

 

 

 

 接下来我们再看看该商品类在时间轴上的订单变化趋势

 

 

可以看出50013636类的商品 订单量最高,而且从时间上看,在几次的促销活动中,他都有出色的表现,说明该商品类是热销产品,那就可以考虑,对该产品

进行重点评估,下次的促销活动能够选择该商品类下的部分商品。

  针对不同用户群体,精准营销

  不同年龄

这边计算的是购买商品时婴儿的年龄,根据购买时间-出生时间,但是中间会存在负值的现象,是因为有一些用品是在宝宝出生前提前购买好的,这里的年龄是四舍五入取整的。

0岁代表了一部分即将出生的婴儿和刚出生不久的婴儿,另外婴儿用品,一般作为家长的喜欢屯,所以这个只是估算婴儿的年龄来分析、

 

 

 

可以看出,婴儿用品大部分集中在0岁到1岁之间,这里1代表的是半岁到1岁半之间的,0代表的是出生前后半岁的,那说明婴儿在出生前到1岁半之间购买量是最大的,并且对于15结尾的产品在0和1之间需求量很大,28和68产品有生前预购。

接下来看看不同性别对于销量的影响

可以看出,女婴在1岁左右对于15结尾类商品需求量比较大,男婴在0-2岁对于68结尾的商品比较大,并且在0-1岁对各类商品的需求都不少。

  • 不同性别

 

可见女婴的购买力明显高于男生,因为2015年只有两个月的数据,所以不参与对比,从整体上销量随着时间的变化呈现上升趋势,说明母婴市场发展良好。

男婴和女婴对于商品类的偏好

可以看出女婴对于15结尾类的商品购买量比较突出,男婴对于68结尾类的商品购买量相对较高,针对女婴,可以考虑对15结尾类商品的大力推广,68结尾类商品需求男女都有,说明是刚需,可以考虑通过更多的数据去分析相关性,搭配套餐带动其他产品的促销活动。

结论与建议:

1.促销活动一定要有针对性,50013636类商品是热销商品,评估后,可以采取相应的促销手段。

2.精准营销,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率,对于女婴产品可以集中在1岁进行15结尾类的商品进行推广,男婴产品可以在0-2岁集中推广。

3.推广渠道按照年龄划分,如果需求量在0-1岁比较大,线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。

4.对于28的商品类和68结尾的商品类销量最大,可以进行大力的宣传和推广,在保证产品质量的同时提高产品的销量。

 

这只是简单 思路 ,大家可以 根据自己的想法,利用之前的分析方法进行不同角度的分析练习

 

posted @ 2020-10-16 15:35  正在学Python  阅读(961)  评论(0编辑  收藏  举报