上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页
摘要: 这几天有点忙,所以没有很多时间把写的东西上传上来,这个拿出来是应一些做市场分析的童鞋的要求,我还记得这是我刚去金山工作时整理的,出处我忘记了,如果有谁知道,别忘记提醒我,这个算是扫盲吧,这几天会陆续上传一些新东西。1.CPC(CostPerClick;CostPerThousandClick-Through)每点击成本 以每点击一次计费。这样的方法加上点击率限制可以加强作弊的难度,而且是宣传网站站点的最优方式。但是,此类方法就有不少经营广告的网站觉得不公平,比如,虽然浏览者没有点击,但是他已经看到了广告,对于这些看到广告却没有点击的流量来说,网站成了白忙活。2.CPM(CostPerMill. 阅读全文
posted @ 2012-05-22 15:00 data->intelligence 阅读(4586) 评论(0) 推荐(0) 编辑
摘要: 早些写过两篇关于关联分析的文章,去年也做过一个简单的案例。然而经过不断的实践和分析,我发现游戏道具的关联分析其实并不是很简单的一件事。可以说游戏道具关联分析相比传统的关联分析策略更加复杂,那么为什么难?这里简单说说我的想法。资源的垄断所谓的资源垄断,这里主要想说游戏社会是我们设计的一个虚拟社会,所有的系统部分都是通过数值控制,并通过不同的手段设法使玩家与系统产生交互,游戏社会本身可以通过自循环满足正常的运转,但是参与到这个系统的玩家都会产生一些需求,而这些需求是来自于玩家的认知和潜在的认知。因此游戏的经济系统设计成为了挖掘游戏社会需求的关键,所以我们会依照系统的运转和玩家的成长需求设计IB。然 阅读全文
posted @ 2012-05-14 22:32 data->intelligence 阅读(3011) 评论(3) 推荐(1) 编辑
摘要: 早些时候写过关于购物篮分析的文章,其中提到了C5.0和Apriori算法,没有仔细说说这算法的含义,昨天写了一下关联分析的理论部分,今天说说关联分析算法之一的Apriori算法,很多时候大家都说,数据分析师更多的是会用就可以了,不必纠结于那些长篇累牍的理论,其实我觉得还是有点必要的,你未必要去设计算法,但是如果你掌握和熟知一个算法,这对于你如何驾驭和使用这个算法是很有帮助的,此外每个算法都有使用的局限性,比如空间和时间复杂度,使用条件约束。最典型的就是我们难道一份原始数据,然后经过数据处理要进行算法模拟分析,但是此时你会出现一个问题,我需要处理哪些数据,如何处理?而这就需要你对你所使用的算法必 阅读全文
posted @ 2012-05-11 16:08 data->intelligence 阅读(9293) 评论(0) 推荐(1) 编辑
摘要: 关联分析的学习在说关联分析之前,先说说自己这段时间的一些感受吧,这段时间相对轻松一些,有一些时间自己自己来学习一些新东西和知识,然而却发现捧着一本数据挖掘理论的书籍在一点一点的研读实在是很漫长,而且看过了没有什么感觉。数据这一行理论很多,算法很多,模型很多,自己现在一直是结合业务来做的数据分析与挖掘,相比电商而言,游戏业做的数据大多很糙,但是仅仅结合业务和运营,更加注重我们客户的质量和维护,当然这不是说电商没做,实际上电商一直在做,然而最近一次经历发现,我们过多的时候去讨论了算法,模型,新理论,新算法研究,比如爬虫,JS,写个脚本测试一下,验证一下,可我一直在考虑,为什么我们要这么做?意义究竟 阅读全文
posted @ 2012-05-10 15:11 data->intelligence 阅读(6918) 评论(1) 推荐(0) 编辑
摘要: 还记得我工作后接触的第一个理论就是长尾理论,后续在培训中又学习了蓝海战略、定位理论、权衡、免费等等。可以说我学到和了解了很多的理论。由于做游戏数据分析工作,因此像SPSS、SAS、Clementine、Excel都能熟练使用,包括很多的模型算法,比如RFM、C5.0、决策树等等很多的内容都有涉及,都有研究,我也相信,时下具备这些所谓“知识”的人不占少数,讲起来滔滔不绝,可是回头来问一句:你确定你懂吗?理论书你真的看透了吗?一个理论的掌握不是你读完了这本理论的书籍,就敢说你掌握了,在当今的社会中,我发现太多的时候我们没有耐心或者以没时间为由,不去读这些书,一个新理论的掌握大概你就是百度百科或者M 阅读全文
posted @ 2012-05-02 16:35 data->intelligence 阅读(2222) 评论(0) 推荐(1) 编辑
摘要: 最近大家都在讨论分列的操作,示例数据如下(红色的部分),有一组数据省市全部显示在一个单元格之中,而这样不利于我们进行一些数据分析,需要把省和市分割到两列中。对于以上的分列方法有很多种,这里就说说两种比较简单的分列这种数据的方法。方法一:使用直接分列法进行数据分割在数据标签下,有分列选项如下图所示。选中我们要分列的数据,然后点击分列,弹出如下的对话框:选择分隔符号,点击下一步,如下所示:此处选择分隔符号为其他,并输入分隔符合为省,如上图设置所示。之后点击下一步,如下图所示:列数据格式选择文本,目标区域就是输出的区域,可以看到数据预览区域已经给出了分列后的形式,点击完成,出现以下的数据内容。按照这 阅读全文
posted @ 2012-04-18 15:06 data->intelligence 阅读(16681) 评论(2) 推荐(1) 编辑
摘要: 前段时间说过一些关于玩家生命周期的问题,其实那些有点大,有点虚,从宏观的角度了解我们此时此刻正在做的分析是属于那一部分,哪一个体系的,说实话,这是为了建立一种意识而要做的工作,玩家生命周期价值源于电信行业的客户生命周期管理和PLC(产品生命周期)的解读和应用,限于本人水平和能力因素,不够深刻,全面,在此请各位谅解,以后的内容会逐步深入到这个体系之下的很多细节的问题探讨,今天就和大家简单说说流失率。说到流失率,我们可以考察,可以分析,可以利用的点实在是太多了,这里我也不可能把所有的东西都覆盖,仅从几个指标来说说,至于其他的关联分析部分需要大家自己来看和分析(不要陷入一个误区,那就是我说的这些就是 阅读全文
posted @ 2012-04-17 19:38 data->intelligence 阅读(11585) 评论(3) 推荐(2) 编辑
摘要: 什么是达克效应?达克效应(D-K effect),全称为邓宁-克鲁格效应(Dunning-Kruger effect)。它是一种认知偏差现象,指的是能力欠缺的人在自己欠考虑的决定的基础上得出错误结论,但是无法正确认识到自身的不足,辨别错误行为。这些能力欠缺者们沉浸在自我营造的虚幻的优势之中,常常高估自己的能力水平,却无法客观评价他人的能力。(百度百科)在Jamie Madigan文章中“阐述多人游戏中的达克效应及其缘由”通过对RTS游戏的分析基本了解达克效应究竟是怎么一回事,对于玩家而言更多人是错误的认为自己已经掌握这款游戏,而实际情况是在某些任务和PK过程中不断的遭受现实带来的压力,玩家掌握 阅读全文
posted @ 2012-04-16 18:36 data->intelligence 阅读(2705) 评论(1) 推荐(2) 编辑
摘要: 前几天,写过一篇关于相关分析的的文章,很多人都看到了并有很多人在咨询关于这篇文章的一些内容,相关分析是一类很有用的分析方法,如之前所提到的,相关分析由三部分组成,前几日的文章是讲了其中第一部分,第二部分是偏相关分析,第三部分就是复相关分析,说白了其实就是相关分析变量的多少来确定这三部分的。今天这里不谈偏相关分析,以为网友给我截图,问我下面的成交量相关系数的是怎么算出来的,其实这个就是复相关的典型应用,多变量的相关分析。插一句,该图来自于腾讯大讲堂15-市场研究及数据分析理念及方法概要介绍。大家如果需要,请到百度文库或者联系我都OK。今天将通过Excel和SPSS向大家说说怎么来进行多变量的相关 阅读全文
posted @ 2012-04-14 22:43 data->intelligence 阅读(2783) 评论(0) 推荐(1) 编辑
摘要: 昨天简单说了一下相关分析在充值购买失衡方面的应用,今天就接着昨天的话题,说一下回归分析(Regression Analysis),回归分析是研究一个变量(因变量)和另一个变量(自变量)关系的统计方法,用最小二乘方法拟合因变量和自变量的回归模型,把一种不确定的关系的若干变量转化为有确定关系的方程模型近似分析,并且通过自变量的变化来预测因变来预测因变量的变化趋势,在回归分析中两个变量的地位是不平等的,考察某一个变量的变化是依存于其他变量的变化程度,就是存在因果关系。今天将利用回归分析对游戏数据分析的某些指标进行分析探讨,有关于回归分析的一些理论这里不再讲解,百度即可。今天针对DAU、PCU、ACU 阅读全文
posted @ 2012-04-11 19:12 data->intelligence 阅读(5084) 评论(5) 推荐(2) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页