摘要:
Spark 一、Spark概述 1.1 Spark简介 •Spark最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序 •2013年Spark加入Apache孵化器项目后发展迅猛,如今已成为A 阅读全文
摘要:
Hadoop架构再探讨 一、Hadoop的优化与发展 1.1Hadoop的局限与不足 Hadoop1.0的核心组件(仅指MapReduce和HDFS,不包括Hadoop生态系统内的Pig、Hive、HBase等其他组件),主要存在以下不足: •抽象层次低,需人工编码 •表达能力有限 •开发者自己管理 阅读全文
摘要:
云数据库 一、云数据库概述 1.1 云计算是云数据库兴起的基础 1.2 云数据库概念 云数据库是部署和虚拟化在云计算环境中的数据库。云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法,它极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易。云数据 阅读全文
摘要:
NoSQL数据库 一、NoSQL简介 最初表示“反SQL”运动用新型的非关系数据库取代关系数据库,现在表示关系和非关系型数据库各有优缺点彼此都无法互相取代。 通常,NoSQL数据库具有以下几个特点: (1)灵活的可扩展性 (2)灵活的数据模型 (3)与云计算紧密融合 二、NoSQL兴起的原因 1、关 阅读全文