摘要: 前言 从今天起,我将一步一步的分享大数据相关的知识,其实很多程序员感觉大数据很难学,其实并不是你想象的这样,只要自己想学,还有什么难得呢? 学习Hadoop有一个8020原则,80%都是在不断的配置配置搭建集群,只有20%写程序! 一、引言(大数据时代) 1.1、从数据中得到信息 我们看一张图片: 阅读全文
posted @ 2018-06-30 17:30 走天涯 阅读(536) 评论(0) 推荐(0) 编辑
摘要: 一、概述 随着OpenStack日渐成为开源云计算的标准软件栈,Ceph也已经成为OpenStack的首选后端存储。Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统。 ceph官方文档 http://docs.ceph.org.cn/ ceph中文开源社区 http://c 阅读全文
posted @ 2018-06-30 12:26 走天涯 阅读(14514) 评论(0) 推荐(3) 编辑
摘要: 一、Hadoop概述: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS分布式文件系统为海量的数据提供了存储,则M 阅读全文
posted @ 2018-06-30 10:40 走天涯 阅读(684) 评论(0) 推荐(0) 编辑