2016年2月12日

浅析Hadoop 1.0与2.0设计原理

摘要: http://www.chinacloud.cn/upload/2014-09/14091910015850.pdf 阅读全文

posted @ 2016-02-12 20:29 淘气小男孩 阅读(155) 评论(0) 推荐(0) 编辑

大型网站架构

摘要: 0 系列目录 应用系统架构 大型网站技术架构的演进与设计 大型网站技术架构的实践 大型网站图片服务器架构的演进 1 设计理念 1.1 空间换时间 多级缓存,静态化 客户端页面缓存(http header中包含Expires/Cache of Control,last modified(304,ser 阅读全文

posted @ 2016-02-12 20:08 淘气小男孩 阅读(769) 评论(0) 推荐(0) 编辑

大数据以及Hadoop相关概念介绍

摘要: 一、大数据的基本概念 1.1、什么是大数据 大数据指的就是要处理的数据是TB级别以上的数据。大数据是以TB级别起步的。在计算机当中,存放到硬盘上面的文件都会占用一定的存储空间,例如: 文件占用的存储空间代表的就是该文件的大小,在计算机当中,文件的大小可以采用以下单位来表示,各个单位之间的转换关系如下 阅读全文

posted @ 2016-02-12 17:52 淘气小男孩 阅读(189) 评论(0) 推荐(0) 编辑

Hadoop产生背景

摘要: 传统的关系型数据库中的表通常由一个或多个字段组成,每个字段都预先定义了其可存储数据的格式及约束等,这类的数据就是结构化数据(structured data)。一个设计良好的数据库在其schema中定义这些格式或约束,并由相应的RDBMS为这些提供实现保证。相应地,非结构化数据(unstructure 阅读全文

posted @ 2016-02-12 17:28 淘气小男孩 阅读(673) 评论(0) 推荐(0) 编辑

hadoop知识体系

摘要: 目录结构知识点还是挺全的,可以按照点学习。 一、Hadoop入门,了解什么是Hadoop 二、分布式文件系统HDFS,是数据库管理员的基础课程 1、Hadoop产生背景 2、Hadoop在大数据、云计算中的位置和关系 3、国内外Hadoop应用案例介绍 4、国内Hadoop的就业情况分析及课程大纲介 阅读全文

posted @ 2016-02-12 13:00 淘气小男孩 阅读(602) 评论(1) 推荐(1) 编辑

hadoop生态系统

摘要: Hadoop从诞生至今已经发展成为一个大数据相关的庞大的软件生态系统。这里收集整理了跟Hadoop相关的Apache下的开源项目,以供后续分析研究。 Apache Hadoop Hadoop是一个大数据处理框架,它可用于从单台到数以千计的服务器集群的存储和计算服务。HadoopDistributed 阅读全文

posted @ 2016-02-12 12:41 淘气小男孩 阅读(156) 评论(0) 推荐(1) 编辑

大数据工具集详

摘要: 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。Phoenix完全使用Java编写,代码位于GitHub上,并且提供了一个客户端可嵌入的JDBC驱动。 Phoenix查询引擎会将SQL查询转换为一个或 阅读全文

posted @ 2016-02-12 11:51 淘气小男孩 阅读(298) 评论(0) 推荐(1) 编辑

大数据工具集

摘要: 类别 名称 官网 备注 查询引擎 Phoenix http://phoenix.incubator.apache.org/ Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写 Stinger http://hortonworks.com/labs/st 阅读全文

posted @ 2016-02-12 11:45 淘气小男孩 阅读(176) 评论(0) 推荐(0) 编辑

导航