R语言&页游渠道分析(转)

对着满屏的游戏后台数据,需要快速了解数据特征,一种茫然无从下手的感觉?

本文在游戏后台数据中,如何通过R语言快速的了解游戏后台的数据特征,以及统计各个数据之间的相关系数,并通过相关图来发现其中相关系数较高的数据,从而通过R得到高相关系数之间的线性回归方程,最后通过矩阵散点图来初步发现数据中的一些规律解决相应的问题。附:本文需要安装corrgram和car包

具体代码如下:

library(corrgram)

library(car)

summary(data9)

cor(data9)

scatterplotMatrix(data9,spread=FALSE,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系")

corrgram(data9,order=TRUE,lower.panel=panel.shade,upper.panel=panel.pie,text.

panel=panel.txt,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系")

其中以某单机网的游戏广告投放后台数据为例

通过R中的summary和cor函数可以得到图一,可以快速了解数据的基本特征和相关系数。

为了方便快速展示数据之间的关联性,可以适当通过图形展示,提高工作效率,如图二,通过使用corrgram包中的corrgram()函数产生的相关图可以快速发现注册框点击和注册的相关系数最高,达到0.98。可以用R语言得到线性回归方程,从而发现从中的规律或者转化率:

myLm<-lm(M[negotiated=TRUE]~Z[negotiate=TRUE],data=data9)

myLm$coefficients

summary(myLm)

得到结果:(Intercept)requested[negotioted==TURE]

20.81 0.21

得到注册框点击Z和注册数M的基本线性回归方程:M=20.81+0.21*Z

而下图三,载入car包中的scatterplotMatrix()函数生成的矩阵散点图,可以快速了解数据之间的规律。仅下图标记2为例,表示流量和注册数的关系,即广告流量越大,注册数越多,则渠道正常。反之,流量越大,注册数保持不变或者下降的趋势,则渠道疲劳,即该渠道对广告产生视觉疲劳,可初步考虑放弃该渠道。同理,当渠道正常,下图标记1,即时间和注册数的关系成反比,则表示用户对素材疲劳,可适当切换新素材,保持点击新鲜度。

 

最后本文通过R语言产生的三个图,可以快速了解数据的基本特征,数据之间的相关性,以及数据之间的分布规律和趋势规律,从而基本达到快速了解游戏后台数据目的。

作者:心者,审稿:fish

 

转自:http://www.itongji.cn/article/012040302015.html

posted @ 2015-01-23 10:21  payton数据之旅  阅读(747)  评论(0编辑  收藏  举报