程序员必须要知道的Hadoop的一些事实
程序员必须要知道的Hadoop的一些事实。现如今,Apache Hadoop已经无人不知无人不晓。当年雅虎搜索工程师Doug Cutting开发出这个用以创建分布式计算机环境的开源软......
1:Hadoop是由多个产品组成的。
2:Apache Hadoop是开源技术,但专有厂商也提供Hadoop产品。
3:Hadoop是一个生态系统,而非一个产品。
4:HDFS是文件系统,而不是数据库管理系统。
5:Hive与SQL类似,却非标准SQL。
6:Hadoop与MapReduce相互关联,但不相互依赖。
7:MapReduce提供的是对分析的控制,而不是分析本身。
8:Hadoop的意义不仅仅在于数据量,更在于数据的多样化。
9:Hadoop是数据仓库的补充,不是数据仓库的替代品。
10:Hadoop不仅仅是Web分析。
11:大数据不一定非Hadoop不可。
12:Hadoop不是“免费午餐”。
最后告知大家:“千万别以为Hadoop是免费的或者很便宜,它背后的隐性开销你是一下子看不到的。”
作者:虾米哥
微信公众号:IT虾米,左侧为二维码
个人技术网站-IT虾米网:http://www.itxm.cn
个人技术网站-编程符号网:http://www.itfh.cn
个人技术网站-IT源码网:http://www.itym.cn
新浪微博:https://weibo.com/u/2814576687
如果你想及时得到个人撰写文章以及著作的消息推送,或者想看看个人推荐的技术资料,可以扫描左边二维码(或者长按识别二维码)关注个人公众号。
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。