摘要:
以下是我从各个网站截图和官网文档找到的资料,仅供学习使用以下是hadoop的发展和应用史说不定面试的话多少要了解1. 这一切,都起源自Web数据爆炸时代的来临2. 数据抓取系统 - Nutch3. 海量数据怎么存,当然是用分布式文件系统 - HDFS4. 数据怎么用呢,分析,处理5. MapReduce框架,让你编写代码来实现对大数据的分析工作6. 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe7. 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop8. MapReduce太麻烦,好... 阅读全文
该文被密码保护。 阅读全文