2010年8月15日

摘要: groupon开创了社交化电子商务的一个新模式,不但取得了巨大成功也大受追捧。其实团购的想法人们一 直都有,很早的时候人们就会集聚起来然后集体购买某一商品以谋求淘宝商家的低价销售。groupon很好地把这一想法搬到了线上,以网站形式展现出来,借助于互联网信息的快速传播进一步扩大了使用人群规模,再借社会化营销的方式逐渐推广。groupon不是社交化营销的第一个案例,但绝对是目前最成功的一个案例。社... 阅读全文
posted @ 2010-08-15 12:09 inmanhust 阅读(1331) 评论(0) 推荐(0) 编辑

2010年5月8日

摘要: 前面已经分析了Infobright的构架,简要介绍了Infobright的压缩过程和工作原理。现在来讨论查询优化的问题。    (1)配置环境    在Linux下面,Infobright环境的配置可以根据README里的要求,配置brighthouse.ini文件。  (2) 选取高效的数据类型    参见前面章节。  (3)使用comment lookup    参见前面章节。  (4)尽量有... 阅读全文
posted @ 2010-05-08 14:23 inmanhust 阅读(3347) 评论(1) 推荐(0) 编辑
摘要: 前面的章节一直涉及到comment lookup,这里将简单介绍comment lookup的使用。  comment lookup只能显式地使用在char或者varchar上面。Comment Lookup可以减少存储空间,提高压缩率,对char和varchar字段采用comment lookup可以提高查询效率。  Comment Lookup实现机制很像位图索引,实现上利用简短的数值类型替代... 阅读全文
posted @ 2010-05-08 13:48 inmanhust 阅读(2495) 评论(0) 推荐(0) 编辑
摘要: Infobright号称数据压缩比率是10:1到40:1。前面我们已经说过了Infobright的压缩是根据DP里面的数据类型,系统自动选择压缩算法,并且自适应地调节算法的参数以达到最优的压缩比。  先看看在我的实验环境下的压缩比率,如下图所示:    相信读者可以很清楚地看到,整体的压缩比率是20.302。但是这里有一个误区,这里的压缩比率指的是数据库中的原始数据大小/压缩后的数据大小,而不是文... 阅读全文
posted @ 2010-05-08 13:24 inmanhust 阅读(2544) 评论(0) 推荐(0) 编辑
摘要: Infobright里面支持所有的MySQL原有的数据类型。其中Integer类型比其他数据类型更加高效。尽可能使用以下的数据类型:  TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT  DECIMAL(尽量减少小数点位数)  DATE ,TIME  效率比较低的、不推荐使用的数据类型有:  BINARY VARBINARY  FLOAT  DOUBLE  VARCHAR... 阅读全文
posted @ 2010-05-08 11:44 inmanhust 阅读(2872) 评论(0) 推荐(0) 编辑
摘要: 前面已经简要分析了Infobright的构架,现在来介绍Infobright的工作原理。  粗糙集(Rough Sets)是Infobright的核心技术之一。Infobright在执行查询的时候会根据知识网络(Knowledge Grid)把DP分成三类:  相关的DP(Relevant Packs),满足查询条件限制的DP  不相关的DP(Irrelevant Packs),不满足查询条件限制... 阅读全文
posted @ 2010-05-08 11:07 inmanhust 阅读(3761) 评论(1) 推荐(0) 编辑

2010年5月7日

摘要: Infobright的总体构架图如下:    如上图所示,Infobright采用了和MySQL一致的构架,分为两层。上层是服务及应用管理,下层是存储引擎。Infobright的默认存储引擎是brighthouse,但是Infobright还可以支持其他的存储引擎,比如MyISAM、MRG_MyISAM、Memory、CSV。Infobright通过三层来组织数据,分别是DP(Data Pack)... 阅读全文
posted @ 2010-05-07 23:35 inmanhust 阅读(12715) 评论(1) 推荐(1) 编辑

2010年3月7日

摘要: 年前听过Sybase中国区副总裁的关于列式数据库的讲座之后就一直被列式数据库强大的性能吸引。最近邂逅了infobright,列式数据库的学习展开了。 Sysbase可以说是列式数据库的先驱,Sysbase IQ 15 就是Sybase 目前最新的列式数据库。它具有强大的功能,包括数据的快速加载、超高速的分析 性能、强大的业务智能分析、领先的数据建模能力等等。 infobrigh... 阅读全文
posted @ 2010-03-07 08:49 inmanhust 阅读(3561) 评论(0) 推荐(0) 编辑

导航