摘要:
1. hadoop 使用什么版本,CDH版本号,是5.3.6 。hadoop的版本是2.72,记住cdh的版本号和hadoop版本号不一样。2. flume是单节点采集数据还是多节点采集数据?flume是自定义框架还是用官方提供的框架?官方框架开发中有什么问题吗? flume是多节点采集数据,框架用 阅读全文
摘要:
说真的,这个模式在我做sql开发的岁月里,从未用到过。用的都是动态分区非严格模式。 我的好友东岳同学在车上问我。确实问到了我 。体现出了我基本功不扎实的情况。 1.what is Hive严格模式 Hive提供了一个严格模式,可以防止用户执行那些可能产生意向不到的不好的效果的查询。说通俗一点就是这种 阅读全文
摘要:
1、初始化k个簇中心。 2、更新所有样本点簇归属:样本点到哪个簇中心点最近就属于哪个簇。 3、重新计算每个簇的中心点(直到簇中心点不再变化或达到更新最大次数) 阅读全文