摘要:
HDFS:分布式存储 YARN:计算资源调度 MapReduce:离线计算(基于磁盘) Tez:构建有向无环图 Spark:基于内存计算 Hive:数据仓库(历史记录) Pig:流数据处理(轻量级的脚本语言) Oozie:作业流调度系统 Zookeeper:分布式协调服务 HBase:列族数据库 F 阅读全文
摘要:
Hadoop可以支持多种语言。 两大核心:HDFS+MapReduce Hadoop具有很好的可扩展性,成本低 版本: 阅读全文
摘要:
概念:物物相连的互联网,是互联网的延申 层次架构: 关键技术:识别技术和感知技术 阅读全文
摘要:
关系 云计算解决的两个核心问题: 分布式存储和分布式处理 云计算典型特征:虚拟化 多租户 云计算的概念:云计算是通过网络以服务的方式为用户提供非常廉价的IT资源 优势:无需自建,可以租用云端资源(购买) 三种模式:公有云,私有云,混合云 三种云服务:IaaS-基础设施即服务 PaaS-平台即服务 S 阅读全文