01 2014 档案

电子商务关键数字优化(线上部分,下)
摘要:转载:http://www.chinawebanalytics.cn/kpi_optimization_part3/【每期一句】 没有对创新的有效保护,就没有创新。我们没有乔布斯,没有扎克伯格,不是国民素质,而是制度使然。【前言】 在这个系列的前面两回文章中(上篇点此,中篇点此),我们谈到了如何优化电子商务关键绩效数字的两个方面:识别关键驱动因素、着手分析和尝试提升关键驱动因素。在这个部分中,我们将向大家展示,如何通过一些特定的方法,让我们提升关键驱动因素的努力能够最终落地获得成效。【正文】 还记得我们前文谈到的优化路径吗?在这个路径中,我们强调从定义KBR开始,然后分解影响KBR绩效的... 阅读全文

posted @ 2014-01-15 16:36 sambazhu 阅读(131) 评论(0) 推荐(0) 编辑

电子商务关键数字优化(线上部分,上)
摘要:转载http://www.chinawebanalytics.cn/kpi_optimization_part1/【每期一句】 没有数字和分析,没有电子商务。【前言】 从事电子商务的工作一段时间,发现自己对于数据的想法有了很多变化。过去,我们拿着国外的理论,然后站在河边的岸上,对河中游泳的人们指指点点。今天,当你也跳入河中,就是全然不同的感受。一方面河水冰冷刺骨,另一方面,也开始理解为什么曾经河中的人们用各种“怪异的姿势”奋力搏击。这一篇文章,是我在杭州参加车品觉老师《智论商道,西湖秋学》活动的演讲整理,也记录了我的“河中感受”。【正文】 这是一个很大很难但也是每一个电商人都会问的问题—... 阅读全文

posted @ 2014-01-15 16:33 sambazhu 阅读(188) 评论(0) 推荐(0) 编辑

创业公司Celebrity Performance 评估名人影响力
摘要:创业公司Celebrity Performance 旨在采用更科学的方法计算名人表现指数。它把传统市场研究数据和网络爬虫获取的全面数据集匹配起来,在其他任务中对社交媒体帖子进行语义分析,之后,统计学家和数据家就有了证据,基于此证据可以分析约7000位名人的“粉丝”或支持者的生活方式。现在该公司的投资者不仅包括一名计算机科学教授、一名心理学家和一名营销顾问,还有一家大型耐用消费品制造商的董事会。 阅读全文

posted @ 2014-01-15 16:28 sambazhu 阅读(165) 评论(0) 推荐(0) 编辑

SQLautoReview - 淘宝开源的SQL自动化审核
摘要:淘宝开源的SQLautoReview是一个SQL自动化审核的程序,三大功能:1,解析sqlmap,利用dom4j从xml文件解析sql语句,并插入数据库中。2,对sql语句进行分析,创建该语句的sql语句的索引脚本。3,对新生成的索引和原有(一般为线上)数据库的索引进行重用或者合并。该代码应用场景是对新应用中增加的sql语句,加入到线上数据库中,更新已有索引,提高效率。 阅读全文

posted @ 2014-01-10 15:29 sambazhu 阅读(1427) 评论(0) 推荐(0) 编辑

互联网/电子商务数据分析师的十大误区
摘要:对于火爆的互联网/电子商务行业,我们需要的是建立起通过数据驱动的商业模式。即我们需要的是有经验的数据分析师,对于运营数据进行解读和分析——确定网站和客户是否为正常的运行,同时发掘其中存在的问题。以下是数据分析师经常犯的错误列表:一、 数据分析报告中呈现的是已知的结论和经验——重复别人的路!二、数据分析报告不能够解决任何商业问题——做没有意义的分析!三、数据分析报告中的原始数据不准确(缺失&错误)!四、市场营销和效果评估报告的本质在于客户的细分——不懂业务和市场,不会细分!五、数据分析报告仅仅在于陈述事实,而非发掘原因!六、迷信于网站统计分析系统越多越完善,殊不知不同的系统的统计标准并非 阅读全文

posted @ 2014-01-10 15:27 sambazhu 阅读(577) 评论(1) 推荐(0) 编辑

Amazon Silk 你所不知道的在Kindle背后的大数据
摘要:Amazon 于2011 年9 月28 日发布的平板电脑Kindle Fire 中,提供了一项非常有意思的服务。该平板电脑采用Android 操作系统,售价只有199 美元,比iPad 要便宜,它上面继承了Amazon 自行开发的新浏览器Amazon Silk。之所以要自行开发一款浏览器,是为了在硬件性能低于PC 的移动设备上实现更快速的网页浏览。为了弥补硬件性能的不足,Amazon 采取了下列对策。(1) 在浏览器的后台利用Amazon 自己的云计算服务EC2,事先对视频、图片等数据量较大的内容进行压缩等处理,将优化后的数据传送给终端。这种方式被Amazon 称为Split Browser, 阅读全文

posted @ 2014-01-10 15:18 sambazhu 阅读(555) 评论(0) 推荐(0) 编辑

Harrah赌场是怎么利用大数据的
摘要:在将数据分析能力作为武器的企业中,有一家很具有代表性,经常在各种事例中被提及,它就是位于美国拉斯维加斯的世界最大的赌场经营企业——Harrah’s Entertainment(2010 年起改名为CaesarsEntertainment)。该公司不仅经营着同名的酒店,还经营着拉斯维加斯的若干家赌场,包括Caesars Palace、BALLY’S、Paris 等。这一类的公司一般都会在大型建筑的建造和设施的更新方面投入巨额的资金。而与竞争对手不同的是,Harrah’s 从1994 年开始就将投资的重点转向CRM 和培养顾客忠诚度的营销活动上。这个机制从1997 年开始运行,现在作为其CRM 战 阅读全文

posted @ 2014-01-09 14:38 sambazhu 阅读(302) 评论(0) 推荐(0) 编辑

Nike可穿戴的大数据玩法
摘要:耐克提供了一款面向iPhone 的慢跑应用Nike+GPS。它可以通过使用GPS 在地图上记录跑步的路线,将这些数据匿名化并进行统计,就可以找出跑步者最喜欢的路线。在体育用品店看来,这样的数据在讨论门店选址计划上是非常有效的。此外,在考虑具备淋浴、储物柜功能的收费休息区以及自动售货机的设置地点、售货品种时,这样的数据也是非常有用的。 阅读全文

posted @ 2014-01-09 14:37 sambazhu 阅读(210) 评论(0) 推荐(0) 编辑

[转]Decide.com是怎么做商品价格预测的
摘要:Decide.com 是一家成立于2010 年的创业型公司,它提供的服务主要是告诉大家数码相机、电脑、智能手机、电视机等数码产品什么时候购买最划算。也许大家都有这样的经历,刚刚买的数码相机和电视机,马上就降价了,真是后悔不已。利用Decide.com 所提供的服务,就可以知道价格上涨和下降的时机,再买这些产品时就不会让自己后悔了。Decide.com 每天要从数百家网上商城中收集超过10 万条家电和数码产品的价格数据,同时还会搜索关于这些产品的博客和新闻报道,以获取是否会有新型号准备发售等信息。这些数据的数据量每天超过25GB,整体用于分析的数据量则高达约100TB。这些收集到的数据会被发送到 阅读全文

posted @ 2014-01-08 13:26 sambazhu 阅读(263) 评论(0) 推荐(0) 编辑

[转]FlightCaster如何预测飞机准点的
摘要:FlightCaster 创立于2009 年,它所提供的服务,是在航空公司发出正式通知6 小时之前,就能够对航班晚点做出预报。FlightCaster 的预报是基于交通统计局的数据、联邦航空局航空交通管制系统指令中心的警报、FlightStats(一个发布航班运营状况信息的网站)的数据、美国气象局的天气预报等所发布的。这些数据都是公开数据,有需要的话,任何人都可以获得。基于这些数据,FlightCaster 可以做出类似“正点概率为3%,轻微晚点(60 分钟以内)概率为14%,晚点60 分钟以上概率为83%”这样的预测。如果预报显示该航班有很大概率会晚点,还会给出相应的理由,如“目的地因暴雨天 阅读全文

posted @ 2014-01-08 13:24 sambazhu 阅读(796) 评论(0) 推荐(0) 编辑

(转)Hadoop的安全机制研究
摘要:1.背景1.1 共享Hadoop集群当前大一点的公司都采用了共享Hadoop集群的模式,这种模式可以减小维护成本,且避免数据过度冗余,增加硬件成本。共享Hadoop是指:(1)管理员把研发人员分成若干个队列,每个队列分配一定量的资源,每个用户或者用户组只能使用某个队列中得资源;(2)HDFS上存有各种数据,有公用的,有机密的,不同的用户可以访问不同的数据。共享集群类似于云计算或者云存储,面临的一个最大问题是安全。1.2 几个概念安全认证:确保某个用户是自己声称的那个用户。安全授权:确保某个用户只能做他允许的那些操作User:Hadoop用户,可以提交作业,查看自己作业状态,查看HDFS上的文件 阅读全文

posted @ 2014-01-08 13:22 sambazhu 阅读(464) 评论(0) 推荐(0) 编辑

如何理解Bounce Rate和Exit Rate
摘要:先说说两者的定义:1)Bounce Rate:从某个特定的页面进入网站的Visit中,有多少百分比什么都没有做(没有点击任何链接),然后就离开了网站(即关闭了这个特定的页面)。例如,你从搜索引擎上搜索“BounceRate”和“Exit Rate”的结果页面中访问我的这篇文章,但显然这篇文章没有引起你的任何兴趣,因此你关闭了这篇文章的浏览器窗口,这对我的网站和对这个页面而言就是一个Bounce。而所有这种Bounce掉的Visit除以总的Visit就是Bounce Rate。2)Exit Rate:“出站率”。Exit Rate的意思是,对某一个特定的页面而言,从这个页面离开网站的Visit占 阅读全文

posted @ 2014-01-08 12:03 sambazhu 阅读(1518) 评论(0) 推荐(0) 编辑

淘宝数据魔方技术架构解析
摘要:转自:http://www.alidata.org/archives/1789淘宝网拥有国内最具商业价值的海量数据。截至当前,每天有超过30亿的店铺、商品浏览记录,10亿在线商品数,上千万的成交、收藏和评价数据。如何从这些数据中挖掘出真正的商业价值,进而帮助淘宝、商家进行企业的数据化运营,帮助消费者进行理性的购物决策,是淘宝数据平台与产品部的使命。为此,我们进行了一系列数据产品的研发,比如为大家所熟知的量子统计、数据魔方和淘宝指数等。尽管从业务层面来讲,数据产品的研发难度并不高;但在“海量”的限定下,数据产品的计算、存储和检索难度陡然上升。本文将以数据魔方为例,向大家介绍淘宝在海量数据产品技术 阅读全文

posted @ 2014-01-08 11:19 sambazhu 阅读(196) 评论(0) 推荐(0) 编辑

淘宝开源的SQL
摘要:nQuery 引擎是数据中间层为应对大数据场景的在线查询的三大难题:长数据、宽数据、杂数据,广泛参考 Big Query、Impala、 PL/SQL、MySQL 、PgSQL、ql.io 等,结合自身业务特点,自行精心设计、实现的一套类SQL 语言(nSQL)及解析、执行引擎,它有着广泛的应用场景与很强的实用价值,能对 *SQL 型数据库提供翻译与兼容,对K/V 数据如HBase、OTS 或其他通用的数据源,它可以作为一个简洁强大的SQL 查询引擎,并以扩展SQL 的创新方式来支持数据JOIN, 结合NodeJS 框架,完全可以提供统一的SQL接口的高并发、高性能的的在线查询服务,解耦前后端 阅读全文

posted @ 2014-01-07 15:26 sambazhu 阅读(439) 评论(0) 推荐(0) 编辑

hadoop2.0之Impala初体验二
摘要:转自:http://labs.chinamobile.com/mblog/52251_204176但是也要注意哦,这个数据比起MPP数据库来说还是差,差得比Hive和Impala比较还要远,那是因为多表关联最考数据本地性(Locality)了,而MPP擅长这点(虽然这次测试中行列混合的两个查询分布键都不一样,而列数据库的SQL2分布键不一样,但仍然效果明显)。所以如果Impala不改变存储结构的话,还是很难和MPP比较性能。但是要注意哦,这是8个节点,如果100个节点以上,特别是有故障发生的情况下,Impala的灵活性和健壮性就可能好多了。接下来看看嵌套查询的时候Impala优化得如何,反正H 阅读全文

posted @ 2014-01-07 15:06 sambazhu 阅读(843) 评论(0) 推荐(0) 编辑

hadoop2.0之Impala初体验一
摘要:转自:http://labs.chinamobile.com/mblog/52251_204175Impala,这个非洲的高角羚,被伟大的Cloudera公司赋予了新的含义。随着2013年5月1日的1.0版本发布,一个构建在HDFS上的非MR机制的SQL解析引擎正在慢慢成熟。Impala相比原来的Hive来说,在解析上有很大的突破,至少我在初体验的时候感觉到有如下几点:1、对SQL92更好的支持,而不是一部分子集。2、不用MapReduce来进行执行,而使用自己的SQL解析和分布式执行引擎,效率有所提升3、充分使用内存来提升效率,所以两次重复查询效果迥异。但是对于Cloudera公司在发布会上 阅读全文

posted @ 2014-01-07 15:05 sambazhu 阅读(2014) 评论(0) 推荐(0) 编辑

这个博客的由来
摘要:笔者从事电信行业大型商业智能系统工作多年,日前从事B2C电商网站类数据分析工作,特开设此微博,在发表好文同时,研究网站分析技术。 阅读全文

posted @ 2014-01-07 13:32 sambazhu 阅读(121) 评论(0) 推荐(0) 编辑

PLSQL Developer 不能连接 oracle 12c 64位 的解决办法 for win 64
摘要:oracle_12c_winx64 安装后有个问题:tnsping orcl 正常sqlplususer/password 正常plsql developeruser/password 不能登录sqlplus user/password@orcl 报“ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务”错误此时,修改oracle\product\12.1.0\dbhome_1\NETWORK\ADMIN\listener.ora按照红色部分修改,增加监听的sid:SID_LIST_LISTENER =(SID_LIST = (SID_DESC = (SID_NAME = .. 阅读全文

posted @ 2014-01-07 13:30 sambazhu 阅读(837) 评论(0) 推荐(0) 编辑

Hadoop中国技术峰会引发Hadoop 2.0风暴
摘要:作为本年度大中华地区规模最大的Hadoop技术峰会,China Hadoop Summit是不会被这两大厂商忽视的。记者日前从大会组委会了解到,Hortonworks亚太区技术总监Jeff Markham将在大会第一天发表主题演讲,重点介绍Hadoop 2.0和YARN的最新消息,以及Hadoop未来的发展方向与亮点,将Hadoop 2.0旋风带至中国!大会第二天,Cloudera的明星工程师Todd Lipcon将进一步分享Hadoop和Hbase的最新特性,Todd Lipcon是Apache Hadoop、HBase和Thrift的Committer和PMC!所以,想要把握Hadoop最 阅读全文

posted @ 2014-01-07 13:23 sambazhu 阅读(261) 评论(0) 推荐(0) 编辑

[转]浅谈B2C的数据分析
摘要:通过数据分析可以知道商业模式是否可行,评判那种推广渠道效率最高,能发现网站、商品结构、物流等各个环节的问题,能评估改进效果。笔者曾半路出家,负责过数据分析工作,理解有限,简单谈谈笔者所知的数据分析吧。新建B2C网站的数据来源有网站统计工具、ERP系统、客服回访问卷投诉等途径。网站数据主要包含:访问量(IPUVPV)、平均浏览时长(浏览量)、新UV比例、跳出率、转化率(注册、订单、支付)、流量来源(搜索、直接、连接、地区、推广)、网页打开时间、网站热点、搜索分析等。ERP数据主要包含:订单量、客单价、毛利率、二次购买率、忠实顾客转化率、顾客流失率、动销率、缺货率、商品价格变化、SKU数量变化、. 阅读全文

posted @ 2014-01-07 13:01 sambazhu 阅读(419) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(8)——Engagement
摘要:转自:http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E5%BA%A6%E9%87%8F%EF%BC%888%EF%BC%89%E2%80%94%E2%80%94engagement/ Engagement在英语里面是一个复杂的词,代表着多种含义,当然最让人愉悦的意义是“订婚”,所以当你在Google图片中搜索这个词的时候,出来的都是钻戒之类的东西。 不过,对于网站分析而言,Engagement就是一个让人捉摸不透的度量了。 首... 阅读全文

posted @ 2014-01-07 12:56 sambazhu 阅读(271) 评论(0) 推荐(0) 编辑

[转载]评测流量来源(Traffic Source)的策略
摘要:转自:http://webanalytics.blog.sohu.com/84677651.html翻译自Tips on Visually Measuring Your Traffic Sources,原作者: Mike Sukmanowsky 衡量你网站最大数量或者质量最好的流量从何而来,是一个网站分析师能做的最基本最重要(也是最简单)的事情。但是,很多情况是,许多网站分析师的网站流量来源报告(traffic sources report)常常看上去是下面的样子: 如果你足够老练,你可能会用饼图做出一个图形化的报告: 对于这两种呈现数据的方法,我都毫无疑义,它们都能很好的总结数据。但是,我还 阅读全文

posted @ 2014-01-07 12:55 sambazhu 阅读(726) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(7)——Impression,Click和CTR
摘要:转自:http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%887%EF%BC%89%E2%80%94%E2%80%94impression%EF%BC%8Cclick%E5%92%8Cctr/ 终于又有时间写些什么了,这样的时间可不多,要倍加珍惜。 前面关于网站分析基本概念的5个文章,都是有关于站点本身的。但是,有一个概念要澄清的是,尽管网站分析的主要分析领域是网站本身,它也需要对网络营.. 阅读全文

posted @ 2014-01-07 12:49 sambazhu 阅读(347) 评论(0) 推荐(0) 编辑

[转载]为什么”Bounce Rate”应该成为一个关键度量
摘要:转自:http://www.chinawebanalytics.cn/%E4%B8%BA%E4%BB%80%E4%B9%88bounce-rate-%E6%98%AF%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E4%B8%AD%E6%9C%80%E5%85%B3%E9%94%AE%E7%9A%84%E4%B8%80%E4%B8%AA%E5%BA%A6%E9%87%8F/ 这个博客最常提到的一些主题,会聚焦在一些对于任何在线营销(网络营销)和网站主都会非常在意的一些度量之上,并且会解释它们如何和在线营销相联系,尤其是在中国。可能在后面的博客中,不会有一个安排的非常. 阅读全文

posted @ 2014-01-07 12:48 sambazhu 阅读(386) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(5)——Bounce Rate
摘要:【转载自】http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%885%EF%BC%89%E2%80%94%E2%80%94bounce-rate/引言:“Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits; 换成英语是:Bounce Rate = Single Page Visits / Total Visits。” 前面我们知道了一些最最基本的概念,现在.. 阅读全文

posted @ 2014-01-07 12:45 sambazhu 阅读(283) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(4)——PV (Page View)
摘要:【转载自】http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%884%EF%BC%89%E2%80%94%E2%80%94pv-page-view/ PV,嗯,看起来和UV有点儿像,而且只差一个字母。后面一个V一定都是指Visitor吧! No!PV的意思是Page View,V是View的首字母,而不是指Visitor或Visit。【点击标题阅读全文】 PV的汉语翻译过来是页面浏览,... 阅读全文

posted @ 2014-01-07 12:44 sambazhu 阅读(265) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(3)——网站分析工具如何辨别UV
摘要:【转载自】http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%883%EF%BC%89%E2%80%94%E2%80%94%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E5%B7%A5%E5%85%B7%E5%A6%82%E4%BD%95/ 在关于UV的上一个文章中(网站分析的最基本概念(2)——UV的概念),我们留了一个尾巴。那就是网站分析工具是如何能够知道哪些 阅读全文

posted @ 2014-01-07 12:39 sambazhu 阅读(190) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(2)——UV
摘要:[转载自]http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%882%EF%BC%89%E2%80%94%E2%80%94uv/ UV,在网络分析里面是非常重要的一个Metric(Metric的意思是度量衡,例如一米两米的米就是一个Metric),也是一个重要的KPI。(什么是KPI?KPI是Key Performance Indicator的缩写,意思就是最重要的参数)。UV是Uniqu. 阅读全文

posted @ 2014-01-07 12:21 sambazhu 阅读(226) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(1)—Visit
摘要:[转载自]http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%881%EF%BC%89%E2%80%94%E2%80%94visit/Visit,汉语翻译过来是“访问”。一个网站(Web Site)就好像一个大厦,里面有很多个不同内容的房间(Page)。你若是进了这个大厦,就是一个来访者(Visitor)。你进来了,东瞅瞅,西瞧瞧,打开一个房间的门,又退出去到另外的房间,或者从一个房间的另外 阅读全文

posted @ 2014-01-07 12:17 sambazhu 阅读(179) 评论(0) 推荐(0) 编辑

[转载]新手应该如何学习网站分析
摘要:【转载自】http://www.chinawebanalytics.cn/how-to-learn-web-analytics-for-newbies-ii-2/ 还是在去年,写了一篇文章《【读者来信】新手该怎样学习网站分析?》(http://www.chinawebanalytics.cn/【读者来信】新手该怎样学习网站分析?/),谈到了网站分析所需要的基础,朋友们很关注,但对于方法的讨论其实不多,我该要补一个续篇,谈谈学习网站分析的方法。是先看书,还是先实践? 我们在学校里学习了很久,但我们要知道,国内的教育是非常失败的。比如英语,如果你学习了十几年还不能跟老外畅所欲言不是你的错,是我.. 阅读全文

posted @ 2014-01-07 12:02 sambazhu 阅读(173) 评论(0) 推荐(0) 编辑

导航

点击右上角即可分享
微信分享提示