电商AARRR模型分析(二)—R语言

AARRR模型可以说是用户运营和业务增长非常重要的模型。模型以用户的生命周期为核心,把增长步骤拆分为5个步骤,分别是:获取用户(Acquisition)、用户激活(Activiation)、用户留存(Retention)、用户变现(Revenue)、用户推荐(Referal)。区别于传统的市场营销人通过广告投放或者品牌营销焦点在于获取用户,而AARRR模型让大家意识到了公司业务的增长需要关注整个用户生命周期,不仅仅涉及到广告投放获取用户,还需要通过产品优化或运营手段等来实现用户的激活、留存、变现和自传播(用户裂变)。否则公司浪费了很多钱获取了大量用户,但是产品没有把用户留下来,那钱就都打水漂了。又或者你产品可以设计出用户自传播的机制,让老用户给你的产品推荐更多的新用户,那就可以减少获取新用户的费用。

一、不同时间尺度下用户行为模式分析

电子商务的迅速发展和移动互联网的普及,使得越来越多的人选择方便快捷的网上购物,淘宝作为国内最大的电商交易平台之一,拥有巨大的流量优势。在淘宝APP上,商品的搜索、分类导航、个性化推荐和广告等通过让用户在短时间内了解到更多可能需要或者喜欢的商品而促进购买,同时可以通过数据埋点,收集和分析用户的数据,实现更精细化的运营。本文基于数据集的特点,利用R对淘宝APP的用户行为数据进行分析,得出可能存在的业务问题,并提出推荐的解决策略。接上个博客,这里着重分析一周内每天的用户行为

library(stringr)
library(dplyr)
library(lubridate)
library(tidyverse)

columns<- cbind("user_id","item_id","category_id","behavior","timestamps")
df=read.csv('UserBehavior.csv',header=FALSE)
names(df) <-columns

columns1<- cbind("user","item","category","behavior","date")
data=df[5000001:8000000,]
names(data) <-columns1

tt<-as.POSIXlt(data$date,origin ='1970-01-01')
date=paste0(year(tt),"-",month(tt),"-",mday(tt))
date<-ymd(date)
data1 <- data.frame(data[,1:4],date,hour(tt))
columns2<- cbind("user","item","category","behavior","date","hour")
names(data1) <-columns2

summary(data1)
data2<- filter(data1,data1$date<= "2017-12-3")
data3<- filter(data2,data2$date >= "2017-11-25")     #后面分析的数据基础
summary(data3)
kk<-table(data3[,c("date","behavior")])              #交叉分组列表
addmargins(kk)
              behavior
date             buy    cart     fav      pv     Sum
  2017-11-25    5955   17116    9163  283830  316064
  2017-11-26    6059   18150    9245  287519  320973
  2017-11-27    6649   16636    8817  271512  303614
  2017-11-28    6131   16540    8639  267496  298806
  2017-11-29    6387   16849    8885  272311  304432
  2017-11-30    6550   17272    9177  278325  311324
  2017-12-01    6218   18861    9088  291565  325732
  2017-12-02    7827   24013   12058  368515  412413
  2017-12-03    7553   23334   11481  362584  404952
  Sum          59329  168771   86553 2683657 2998310
kk<-table(data3[,c("date","behavior")])
addmargins(kk)
kk1=as.data.frame(kk)
kk2=spread(kk1,key=behavior,value = Freq)
plot(data.frame(kk2$date,kk2$pv))
lines(data.frame(kk2$date,kk2$pv),type = "o", col = "red")


其他时间的客户行为分析(略)。

二、 不同商品种类的用户行为

2.1 统计浏览次数、收藏次数和加入购物车次数最多的商品

#购买量最多的30种商品
ll<-table(data3[,c("item","behavior")])
ll1=as.data.frame(ll)
ll2=spread(ll1,key=behavior,value = Freq)
ll3<- ll2  %>%  mutate(rank1 = min_rank(desc(ll2$buy))) %>% arrange(rank1)
ll4<-filter(ll3,ll3$rank1<=30)
#购买量最多的30种商品
     item buy cart fav  pv rank1
1  3122135  34    8   8  51     1
2  3031354  26   46  22 524     2
3  5140357  24    6   1  93     3
4  1910706  23    3   2  48     4
5  2964774  23   21   9 215     4
6  3189426  20   11   0 116     6
7  2560262  17   38   5 321     7
8  1813380  16   12   1  80     8
9  3251377  16    9   6  79     8
10 4443059  16   28   8 420     8
p_cor <-ggplot(ll4, aes(rank1, buy)) + 
  geom_tile(aes(fill = rank1),colour = "white") 
p_cor + scale_fill_gradient(name="Value", low = "white",high = "red") +
  theme(axis.text.x = element_text(vjust = 0.5, hjust = 0.5, angle = 90))+
  coord_fixed(ratio=1)+
  theme(axis.text= element_text(size = 8,family="ARL"))+
  theme(plot.margin = unit(c(0.1,0,0,0), unit="mm"))+
  labs(x = "排名", y = "购买次数")+
  theme(plot.title = element_text(size = 13,hjust = 0.5,family = "ARL" ))+
  theme(legend.key.width=unit(3,'mm'),legend.key.height=unit(3,'cm'))+
  theme(legend.title = element_text(size = 8))+
  geom_text(aes(rank1, buy, label = item), color = "blue", size = 3)

2.2 统计所有商品的购买次数

ll<-table(data3[,c("item","behavior")])
ll1=as.data.frame(ll)
ll2=spread(ll1,key=behavior,value = Freq)
ll3<- ll2  %>%  mutate(rank1 = min_rank(desc(ll2$buy))) %>% arrange(rank1)
ll4<-filter(ll3,ll3$rank1<=100)
plot(ll4$rank1,ll4$buy)

length(unique(ll3$item))
length(filter(ll3,ll3$buy==1))

根据分析的数据,只购买一次的商品有38248种,本次分析的商品有805829种,占商品总数的4.75%,说明商品点击转化率很低,还可以分析售卖到底依靠爆款商品的带动,还是主要依靠长尾商品的累计效应,可以从商品购买分布和相关累积购买数额等方面展开分析,这些都是进一步挖掘的专题,鉴于本文的目的,不做扩展。

总结

到这里基本把AARRR模型简单的讲了一遍,不过要用好AARRR模型可不是这么简单,里面有很多道道,后续有空把每个环节都可以仔细详解一下。这套模型基本可以用于任何行业,假如你经营了一个餐厅,你完全可以用这个模型来提升你餐厅的销售额,获客方面,你可以通过微信做个人号或者微信群的裂变拉新;用户激活的话你可以通过给新用户一些体验券或者优惠券,来让用户体验到你们店的好味道和好服务,留存方面,现在基本做的好的餐饮企业都会做私域流量(微信群运营客并留存客户)或公众号。

参考文献

1.(淘宝用户行为数据分析)[https://blog.csdn.net/weixin_42739997/article/details/119765990]
2.(淘宝用户行为数据分析)[https://www.likecs.com/show-180687.html]

posted @   郝hai  阅读(444)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
点击右上角即可分享
微信分享提示