相关推荐
淘宝母婴购物数据分析
2024-11-10 17:01

一、数据集概述

​ 今天我们来看一个来着阿里云天池的数据集:淘宝母婴购物数据,有两个csv文件:

淘宝母婴购物数据分析

mum_baby.csv

mum_baby_trade_history.csv

1、mum_baby.csv

它包含了953个孩子的生日和性别信息,这些信息是由淘宝或天猫的消费者提供的。

列描述user_id用户 ID (Bigint).birthdayChildren’s birthday (e.g. 20130423).genderChildren’s gender (“0” 女, “1” 男, “2” 未知).
2、mum_baby_trade_history.csv

该表包含29971条淘宝用户的历史交易信息。

列描述ID (Bigint).user_id用户ID (Bigint).auction_id购买行为编号ID (Bigint).cat_idCategory ID (Bigint). 类别IDcat1Root category ID (Bigint). 根类别IDpropertyProperty of the corresponding item (String). 对应项的属性buy_mountPurchase quantity (Bigint). 采购量dayTimestamp.
3、分析方向

1.什么商品类别销量最佳

2.用户为之购买商品的婴儿年龄、性别分布

3.销量与月份关系?

4.用户复购情况?

二、数据预处理

以时间段较长的奶粉为例.

对配方奶粉的分段,主要是根据国际食品法典委员会制定的cac来进行划分。

婴幼儿奶粉现在大范围上基本分为一段、二段、三段,部分婴幼儿奶粉可能会分为四段、五段。

奶粉分段及适用年龄

​ 第1段婴幼儿奶粉适合0~6个月的宝宝

​ 第2段婴幼儿奶粉适合6~12个月的宝宝

​ 第3段婴幼儿奶粉适合1周岁~3周岁的宝宝

​ 第4段奶粉适合3周岁~7周岁的孩子。

7周岁最多为365*7=2555天,那么对于天数大于2560天的天数视为无效数据,删除行。

 

三、数据可视化

0、导入包和数据
 
1、消费者行为分析
 

请添加图片描述

​ 由图可知,商品编号为28的销量最高,而50014815次之,而122650008的销量最低,应对此现状提高或减少生产量或者加大宣传力度。

2、不同性别用户的销售情况
 

请添加图片描述

​ 由图可知,婴幼儿为女孩的销售量较女孩更大一些,而未出生购买商品的用户占比很小,所以应该加大用户家婴幼儿是女孩的推广力度以及产品制造。

3、不同性别购买商品种类的关系
 

请添加图片描述

4、销量与月份关系
 

请添加图片描述

 

推测1:节日因素,在5月有劳动节,母亲节;9月有中秋节;而是10月到11月左右有国庆节、万圣节、立冬、感恩节等节日,平台在这些节日可能绘有促销打折,这时随着价格降低需求量会增加,同时销售量也会增加。 推测2:双十一打折力度高,淘宝双十一是从2009年开始便存在的大型购物促销狂欢日,而又伴随着即将到来的春节假期,顾客可能进行囤货,结合两个因素导致需求量大幅上升,所以在11月前会出现一个大型的销量波峰。 结论:在5月与9月以及11月需要加大供货量,保证供需平衡。

分析波谷:每年的1月左右会出现一个明显的销量波谷,说明这段时间的销量较同期低。 推测:1月份正值春节,店铺休息,而开着的店铺肯定会抬高物价,而用户在11月进行囤货所以导致1月份的需求量减小,出现销量波谷。 结论:1月销量惨淡,需要考虑减少进货量的问题,适当降低物价拓宽销售渠道加大宣传力度。

5.用户复购率分析
 
 

 
 
 

请添加图片描述

​ 共29971条订单记录而复购率仅为0.09%,用户粘性差,可能由于多种原因共同导致,其中可能包括产品质量差,客服服务态度差,售后保障差等多种原因。商家必须要仔细查找更多原因来保证后续提高销售质量,提高用户的复购率。 height=[‘2’,‘4’,‘8’,‘19’]) ax = plt.gca() ax.set_xlabel(“商品分类”) ax.set_ylabel(“销量”) plt.show()

    以上就是本篇文章【淘宝母婴购物数据分析】的全部内容了,欢迎阅览 ! 文章地址:http://dgaty.xhstdz.com/quote/60613.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://dgaty.xhstdz.com/mobile/ , 查看更多   
发表评论
0评