随笔分类 - 大数据与云计算
摘要:http://www.mxchip.com/talk/news/jishuwenzhang/2014-09-11/67.html
阅读全文
摘要:数据库保存记录的机制是建立在文件系统上的,索引也是以文件的形式存储在磁盘上,在数据库中用到最多的索引结构就是B树。尽管索引在数据库领域是不可缺少的,但是对一个表建立过多的索引会带来一些问题,索引的建立要花费系统时间,同时索引文件也会占用磁盘空间。如果并发写入的量很大,每个插入的文档都要建立索引,可想...
阅读全文
摘要:1.1 什么大数据 具体来说,大数据技术涉及到数据的创造,存储,获取和分析,大数据的主要特点有下面几个: 数据量大。一个典型的PC机载2000年前后其存储空间可能有10GB,今天facebook一天增加的数据量就将近有500TB;一架波音737的飞机绕美国飞行一周将会产生200TB的数据;移动互联网
阅读全文
摘要:原文地址:http://www.linuxidc.com/Linux/2014-03/99055.htm我们用MapReduce进行数据分析。当业务比较复杂的时候,使用MapReduce将会是一个很复杂的事情,比如你需要对数据进行很多预处理或转换,以便能够适应MapReduce的处理模式,另一方面,...
阅读全文
摘要:http://www.aboutyun.com/blog-61-62.html
阅读全文
摘要:http://wenku.baidu.com/link?url=UGoPtZviipHzi5SDIlGx6hPFWAHTPLFXcZ7ieD15JMd81DEHqjehvphVMhqELmOK4qXR74dTT9nW8VBoApBc7Kfb1ZWrNF_i24fY1YRHVki
阅读全文