hadoop简介

一句话简述:Hadoop是一个适合海量数据的分布式存储和分布式计算的平台。

Hadoop的由来

Google

爬取全球的网站,然后计算页面的PageRank

要解决网站的问题:

a:这些网站怎么存放

b:这些网站应该怎么计算

发布了三篇论文

a:GFS(Google File System)

b:MapReduce(数据计算方法)

c:BigTable:HBase

 

 

Doug cutting 花费了自己的两年业余时间,将论文实现了出来;.看到他儿子在牙牙学语时,抱着黄色小象,亲昵的叫 hadoop,他灵光一闪,就把这技术命名为 Hadoop,而且还用了黄色小象作为标示 Logo,不过,事实上的小象瘦瘦长长,不像 Logo 上呈现的那么圆胖。“我儿子现在 17 岁了,所以就把小象给我了,有活动时就带着小象出席,没活动时,小象就丢在家里放袜子的抽屉里。” Doug Cutting 大笑着说。

 

 

Hadoop(java)

自1.x

HDFS                       分布式文件系统

MapReduce       计算框架

2.x之后多了 yarn     作业调度和集群资源管理框架

 

 

一句话简述:Hadoop是一个适合海量数据分布式存储分布式计算的平台。

 

 

 

 

 

 

 

 

 

 

 

posted @   明前奶绿  阅读(75)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
点击右上角即可分享
微信分享提示