摘要:
这个七月着实忙碌了好久,也是工作的小事情不断,回头想想自己忙什么了,感觉好像真的没什么忙的,不过却又忙碌了这些天。这也是导致这么多天啥也没写的原因。确实现在有点感受到了一个好朋友说的,东西很散,有时候太忙了,没办法写出来。体味了一下这样的感觉,确实很忙,不过每天还是可以拿出那么一点时间来谢谢东西。这几天和一个圈里的好友聊天,问我怎么来看待现在的工作状态。她也是一个做网游数据分析的分析师,她说一天的工作除了固定的发完每天要做的那部分,似乎剩下的时间就没了什么事可做,最感觉有点后怕的是,作为一个leader,下面一群人还需要指点和安排。这种空洞让她有些不能心安。事实上,我有很长的一段时间也是这种状 阅读全文
摘要:
这是一篇很早的杂文了,当时我记得是看到在线平高比比较好奇,索性就研究了一番,后来很多人对我这种行为很不理解,就是一个简单的在线平高比,有什么可以研究和追问的。但是,其中仔细研究下发现还不是那么简单的。接下来我们解决几个问题。什么是在线平高比在线平高比,也有叫做CCU比率的,即平均在线占最高在线比例,公式就是R=ACU/PCU。这个公式看似很简单,大家估计很多人都会使用,那么究竟这个公式要说明什么问题?在解释问题之前简单的把ACU和PCU说明一下,因为很多人还不清楚。ACU平均同时在线人数定义统计当日所有统计时刻中总在线人数的平均值,即总的在线人数的和除以统计时刻数。比如:在00:00:00—— 阅读全文
摘要:
Clementine是一个很有用的工具,在网游日常数据的处理中,其应用程度不低于Excel和SPSS,尽管Clementine是一个数据挖掘工具,但是在数据处理等方面的功能很强大,在几十万到几百万甚至几千万数据处理上,都能够应付,而Excel仅仅处理在一百万左右的数据。使用Clementine有一段时间了,就从基本的开始说起吧,先说说源节点是什么?每一个数据处理工具,都需要支持很多种数据格式,由于我们数据存储形式,或者存储软件的因素造成了我们有时候数据的格式会有很多种,为此作为一个好的数据分析软件,首要的就是要支持很多的数据格式,这样避免的大数据转换格式耗费的时间和成本。在Clementine 阅读全文
摘要:
上次简单的说了一下SPSS下使用两步聚类分析的大致过程,今天简单说说在Clementine下怎么进行聚类分析,方法同样是两步聚类。之前说过聚类分析是无指导的,揭示的输入字段集的模式,不是一种预测。在我们输入的字段上进行聚类分析找出组合最佳,能够反映共同属性的模式。两步聚类有两步,第一步是扩展,处理成若干子聚类,第二步利用分层聚类方法进行合并,形成大的聚类,实际上是剪枝合并的过程,此步不再进行数据处理。分层聚类不需要确定聚类数,这点在两步聚类分析中得以避免,因为分层聚类经常因为处理大数据量而失败,但是第一步的数据预处理得以避免了这个问题的出现。两步聚类分析的数据要求1) 角色设置必须为输入,其他 阅读全文
摘要:
昨天分享了以前学习的聚类分析算法K-Means的部分知识,其实这个主要是了解一下这个算法的原理和适用条件就行了,作为应用而不是作为深入研究,能够很好的将业务和算法模型紧密结合的又有几人呢?所以一些基本知识还是很必要的,这里就是简单把看过的一些知识点列举一下,梳理一下,快速了解和使用。今天把TwoSteps的知识也梳理一下,顺便做个小的演示,使用SPSS 19,后续在使用SPSS Modeler或者叫做Clementine再演示一次使用方法。首先上图。TwoSteps支持数值型和分类型数据,这对于我们而言在使用时就方便很多,此外游戏数据一般来说都很大,TwoStep在这方面来说还是很具有优势的, 阅读全文
摘要:
聚类分析是一类广泛被应用的分析方法,其算法众多,目前像SAS、Splus、SPSS、SPSSModeler等分析工具均以支持聚类分析,但是如何使用,尤其在网游数据分析方面,作用还是很大的,尤其是我们对于某些客群的分析时,排除人为的分组的干扰,客观和全面的展现客群的特征是一件很重要的事。网游玩家的消费特征、游戏行为特征(副本、任务、交互)、不同生命周期的玩家特征(新登玩家、留存玩家、流失玩家、回流玩家)等等,应用很广泛,然而我们发现有时候我们的划分是带有主观色彩的。比如明确分组变量、确定分组标准等等。这些特征的提取和指定往往需要很多的行业经验和大量尝试,而我们只希望分组时兼顾更多的因素和客观事实 阅读全文
摘要:
昨天发现充值异常增高,于是准备做一次详尽的分析,但是当我开始提取数据时,发现了一件比较异常的事情,这是在查询玩家的购买记录时发现的(这是因为往往我们要分析充值时,也要辅助的去看一下当日的购买情况),截图如下:可以看得到玩家对于该道具的购买需求很高,在一段时间内不断的购买,但是商城不支持批量购买,玩家每次交易只能买一件,然后再次点击再次购买。看到这里,我点蛋疼了。针对这个问题,昨晚和BOSS聊了一些,就是在讨论商城购买支付环节的问题。总的理解起来是目前的商城购买UI已经是确定符合玩家的习惯的UI,之所以之前没有做批量购买的原因在于手机网游在商城的购买如果玩家输入数量是需要切换输入法并且需要时间的 阅读全文
摘要:
早先在公司参加了一次付费渗透率的培训,后来觉得蛮有意思的,拿出来和大家分享一下,顺便说说我的看法。在游戏运营数据分析中有一个非常重要的指标就是一个游戏的付费渗透率,所谓付费渗透率就是在一个游戏中,付费玩家占整个活跃玩家的比例,用数学表达式就是付费玩家数/活跃玩家数。“宏观上来说,付费渗透率代表了在玩家群体的付费意愿、消费观念和目前的游戏消费能力。”某种程度上,这说明了游戏本身付费玩家转化能力,IB,经济系统是否为玩家所接受,是对OBT之后游戏收益能力的一个有效指标(当然也要结合APA,ARPU来看)。玩家的付费意愿代表了一部分玩家是否接纳这款游戏,抉择是不是要玩下去,购买的意愿与金钱之间玩家要 阅读全文
摘要:
最近在重新整理日报,周报,月报的数据展现形式,越发觉得一份数据如何展现对于我们数据分析师的受众而言是非常重要的,数据是一种艺术,其原因之一在于如何把数字通过我们的处理变成一张漂亮的图形,意义有时候很重要,换句话,这也是体现一个人的态度和实力的渠道。前段时间看了《Excel图表之道》这本书,收益良多。打开了我的数据展现和分析的思路,一份数据在不同的、合理的图表展示出来,代表和反映了不同的信息。恰好一位网友给我看了一张图,我觉得挺好,有些情况下我们可以这么拿出来秀一下,但更多的是展示信息给我们的受众。展示的图表如下:这张图表应该算是时下比较流行的infographic。看似用Excel不能完成,如 阅读全文
摘要:
最近看了很多关于流失分析的文章,也构建了一些模型,流失这个问题看似有些让人抓不住一根主线来做,这几天也有几个朋友问我怎么来做流失的分析,但是最近工作变动,外加上很忙,就没有很好的跟他们说说这个问题。说道流失流失分析,很多人都知道使用决策树算法,C5.0、Chaid、Quest或者贝叶斯,也有用聚类分析的,总的来说流失分析的方法很多,但这些都是技术层面的,也算不上是一个流失模型。前几天看到一篇文章来讲述怎么分析永恒之塔的流失(http://www.dmacn.com/viewthread.php?tid=31&extra=page%3D1),方法和过程真的很不错,不过流失分析远比这个还要 阅读全文