2014年1月7日

淘宝开源的SQL

摘要: nQuery 引擎是数据中间层为应对大数据场景的在线查询的三大难题:长数据、宽数据、杂数据,广泛参考 Big Query、Impala、 PL/SQL、MySQL 、PgSQL、ql.io 等,结合自身业务特点,自行精心设计、实现的一套类SQL 语言(nSQL)及解析、执行引擎,它有着广泛的应用场景与很强的实用价值,能对 *SQL 型数据库提供翻译与兼容,对K/V 数据如HBase、OTS 或其他通用的数据源,它可以作为一个简洁强大的SQL 查询引擎,并以扩展SQL 的创新方式来支持数据JOIN, 结合NodeJS 框架,完全可以提供统一的SQL接口的高并发、高性能的的在线查询服务,解耦前后端 阅读全文

posted @ 2014-01-07 15:26 sambazhu 阅读(438) 评论(0) 推荐(0) 编辑

hadoop2.0之Impala初体验二

摘要: 转自:http://labs.chinamobile.com/mblog/52251_204176但是也要注意哦,这个数据比起MPP数据库来说还是差,差得比Hive和Impala比较还要远,那是因为多表关联最考数据本地性(Locality)了,而MPP擅长这点(虽然这次测试中行列混合的两个查询分布键都不一样,而列数据库的SQL2分布键不一样,但仍然效果明显)。所以如果Impala不改变存储结构的话,还是很难和MPP比较性能。但是要注意哦,这是8个节点,如果100个节点以上,特别是有故障发生的情况下,Impala的灵活性和健壮性就可能好多了。接下来看看嵌套查询的时候Impala优化得如何,反正H 阅读全文

posted @ 2014-01-07 15:06 sambazhu 阅读(843) 评论(0) 推荐(0) 编辑

hadoop2.0之Impala初体验一

摘要: 转自:http://labs.chinamobile.com/mblog/52251_204175Impala,这个非洲的高角羚,被伟大的Cloudera公司赋予了新的含义。随着2013年5月1日的1.0版本发布,一个构建在HDFS上的非MR机制的SQL解析引擎正在慢慢成熟。Impala相比原来的Hive来说,在解析上有很大的突破,至少我在初体验的时候感觉到有如下几点:1、对SQL92更好的支持,而不是一部分子集。2、不用MapReduce来进行执行,而使用自己的SQL解析和分布式执行引擎,效率有所提升3、充分使用内存来提升效率,所以两次重复查询效果迥异。但是对于Cloudera公司在发布会上 阅读全文

posted @ 2014-01-07 15:05 sambazhu 阅读(2014) 评论(0) 推荐(0) 编辑

这个博客的由来

摘要: 笔者从事电信行业大型商业智能系统工作多年,日前从事B2C电商网站类数据分析工作,特开设此微博,在发表好文同时,研究网站分析技术。 阅读全文

posted @ 2014-01-07 13:32 sambazhu 阅读(121) 评论(0) 推荐(0) 编辑

PLSQL Developer 不能连接 oracle 12c 64位 的解决办法 for win 64

摘要: oracle_12c_winx64 安装后有个问题:tnsping orcl 正常sqlplususer/password 正常plsql developeruser/password 不能登录sqlplus user/password@orcl 报“ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务”错误此时,修改oracle\product\12.1.0\dbhome_1\NETWORK\ADMIN\listener.ora按照红色部分修改,增加监听的sid:SID_LIST_LISTENER =(SID_LIST = (SID_DESC = (SID_NAME = .. 阅读全文

posted @ 2014-01-07 13:30 sambazhu 阅读(834) 评论(0) 推荐(0) 编辑

Hadoop中国技术峰会引发Hadoop 2.0风暴

摘要: 作为本年度大中华地区规模最大的Hadoop技术峰会,China Hadoop Summit是不会被这两大厂商忽视的。记者日前从大会组委会了解到,Hortonworks亚太区技术总监Jeff Markham将在大会第一天发表主题演讲,重点介绍Hadoop 2.0和YARN的最新消息,以及Hadoop未来的发展方向与亮点,将Hadoop 2.0旋风带至中国!大会第二天,Cloudera的明星工程师Todd Lipcon将进一步分享Hadoop和Hbase的最新特性,Todd Lipcon是Apache Hadoop、HBase和Thrift的Committer和PMC!所以,想要把握Hadoop最 阅读全文

posted @ 2014-01-07 13:23 sambazhu 阅读(257) 评论(0) 推荐(0) 编辑

[转]浅谈B2C的数据分析

摘要: 通过数据分析可以知道商业模式是否可行,评判那种推广渠道效率最高,能发现网站、商品结构、物流等各个环节的问题,能评估改进效果。笔者曾半路出家,负责过数据分析工作,理解有限,简单谈谈笔者所知的数据分析吧。新建B2C网站的数据来源有网站统计工具、ERP系统、客服回访问卷投诉等途径。网站数据主要包含:访问量(IPUVPV)、平均浏览时长(浏览量)、新UV比例、跳出率、转化率(注册、订单、支付)、流量来源(搜索、直接、连接、地区、推广)、网页打开时间、网站热点、搜索分析等。ERP数据主要包含:订单量、客单价、毛利率、二次购买率、忠实顾客转化率、顾客流失率、动销率、缺货率、商品价格变化、SKU数量变化、. 阅读全文

posted @ 2014-01-07 13:01 sambazhu 阅读(416) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(8)——Engagement

摘要: 转自:http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E5%BA%A6%E9%87%8F%EF%BC%888%EF%BC%89%E2%80%94%E2%80%94engagement/ Engagement在英语里面是一个复杂的词,代表着多种含义,当然最让人愉悦的意义是“订婚”,所以当你在Google图片中搜索这个词的时候,出来的都是钻戒之类的东西。 不过,对于网站分析而言,Engagement就是一个让人捉摸不透的度量了。 首... 阅读全文

posted @ 2014-01-07 12:56 sambazhu 阅读(267) 评论(0) 推荐(0) 编辑

[转载]评测流量来源(Traffic Source)的策略

摘要: 转自:http://webanalytics.blog.sohu.com/84677651.html翻译自Tips on Visually Measuring Your Traffic Sources,原作者: Mike Sukmanowsky 衡量你网站最大数量或者质量最好的流量从何而来,是一个网站分析师能做的最基本最重要(也是最简单)的事情。但是,很多情况是,许多网站分析师的网站流量来源报告(traffic sources report)常常看上去是下面的样子: 如果你足够老练,你可能会用饼图做出一个图形化的报告: 对于这两种呈现数据的方法,我都毫无疑义,它们都能很好的总结数据。但是,我还 阅读全文

posted @ 2014-01-07 12:55 sambazhu 阅读(716) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(7)——Impression,Click和CTR

摘要: 转自:http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%887%EF%BC%89%E2%80%94%E2%80%94impression%EF%BC%8Cclick%E5%92%8Cctr/ 终于又有时间写些什么了,这样的时间可不多,要倍加珍惜。 前面关于网站分析基本概念的5个文章,都是有关于站点本身的。但是,有一个概念要澄清的是,尽管网站分析的主要分析领域是网站本身,它也需要对网络营.. 阅读全文

posted @ 2014-01-07 12:49 sambazhu 阅读(344) 评论(0) 推荐(0) 编辑

[转载]为什么”Bounce Rate”应该成为一个关键度量

摘要: 转自:http://www.chinawebanalytics.cn/%E4%B8%BA%E4%BB%80%E4%B9%88bounce-rate-%E6%98%AF%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E4%B8%AD%E6%9C%80%E5%85%B3%E9%94%AE%E7%9A%84%E4%B8%80%E4%B8%AA%E5%BA%A6%E9%87%8F/ 这个博客最常提到的一些主题,会聚焦在一些对于任何在线营销(网络营销)和网站主都会非常在意的一些度量之上,并且会解释它们如何和在线营销相联系,尤其是在中国。可能在后面的博客中,不会有一个安排的非常. 阅读全文

posted @ 2014-01-07 12:48 sambazhu 阅读(384) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(5)——Bounce Rate

摘要: 【转载自】http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%885%EF%BC%89%E2%80%94%E2%80%94bounce-rate/引言:“Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits; 换成英语是:Bounce Rate = Single Page Visits / Total Visits。” 前面我们知道了一些最最基本的概念,现在.. 阅读全文

posted @ 2014-01-07 12:45 sambazhu 阅读(279) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(4)——PV (Page View)

摘要: 【转载自】http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%884%EF%BC%89%E2%80%94%E2%80%94pv-page-view/ PV,嗯,看起来和UV有点儿像,而且只差一个字母。后面一个V一定都是指Visitor吧! No!PV的意思是Page View,V是View的首字母,而不是指Visitor或Visit。【点击标题阅读全文】 PV的汉语翻译过来是页面浏览,... 阅读全文

posted @ 2014-01-07 12:44 sambazhu 阅读(265) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(3)——网站分析工具如何辨别UV

摘要: 【转载自】http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%883%EF%BC%89%E2%80%94%E2%80%94%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E5%B7%A5%E5%85%B7%E5%A6%82%E4%BD%95/ 在关于UV的上一个文章中(网站分析的最基本概念(2)——UV的概念),我们留了一个尾巴。那就是网站分析工具是如何能够知道哪些 阅读全文

posted @ 2014-01-07 12:39 sambazhu 阅读(188) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(2)——UV

摘要: [转载自]http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%882%EF%BC%89%E2%80%94%E2%80%94uv/ UV,在网络分析里面是非常重要的一个Metric(Metric的意思是度量衡,例如一米两米的米就是一个Metric),也是一个重要的KPI。(什么是KPI?KPI是Key Performance Indicator的缩写,意思就是最重要的参数)。UV是Uniqu. 阅读全文

posted @ 2014-01-07 12:21 sambazhu 阅读(226) 评论(0) 推荐(0) 编辑

[转载]网站分析的最基本度量(1)—Visit

摘要: [转载自]http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E6%9C%80%E5%9F%BA%E6%9C%AC%E6%A6%82%E5%BF%B5%EF%BC%881%EF%BC%89%E2%80%94%E2%80%94visit/Visit,汉语翻译过来是“访问”。一个网站(Web Site)就好像一个大厦,里面有很多个不同内容的房间(Page)。你若是进了这个大厦,就是一个来访者(Visitor)。你进来了,东瞅瞅,西瞧瞧,打开一个房间的门,又退出去到另外的房间,或者从一个房间的另外 阅读全文

posted @ 2014-01-07 12:17 sambazhu 阅读(178) 评论(0) 推荐(0) 编辑

[转载]新手应该如何学习网站分析

摘要: 【转载自】http://www.chinawebanalytics.cn/how-to-learn-web-analytics-for-newbies-ii-2/ 还是在去年,写了一篇文章《【读者来信】新手该怎样学习网站分析?》(http://www.chinawebanalytics.cn/【读者来信】新手该怎样学习网站分析?/),谈到了网站分析所需要的基础,朋友们很关注,但对于方法的讨论其实不多,我该要补一个续篇,谈谈学习网站分析的方法。是先看书,还是先实践? 我们在学校里学习了很久,但我们要知道,国内的教育是非常失败的。比如英语,如果你学习了十几年还不能跟老外畅所欲言不是你的错,是我.. 阅读全文

posted @ 2014-01-07 12:02 sambazhu 阅读(173) 评论(0) 推荐(0) 编辑

导航