摘要:
一个分布式系统里面,节点组成的网络本来应该是连通的。然而可能因为一些故障,使得有些节点之间不连通了,整个网络就分成了几块区域。数据就散布在了这些不连通的区域中。这就叫分区。 当你一个数据项只在一个节点中保存,那么分区出现后,和这个节点不连通的部分就访问不到这个数据了。这时分区就是无法容忍的。 提高分 阅读全文
摘要:
转载自http://www.cnblogs.com/lucus-jia/p/3483511.html java 第三方库 总结一下常用的java第三方库,方便查询和使用,欢迎补充。 1、核心库 Apache Commons Lang:来自Apache的核心库,为java.lang API补充了许多常 阅读全文
摘要:
lombok, findbugs, Key promoter, Alibaba Java Coding Guidelines,Maven Helper,GsonFormat 阅读全文
摘要:
将实际使用类的启动类改为如下形式启动: 阅读全文
摘要:
Spark的api运算函数分为两大类,Transformation和Action:Transformations是lazy evaluation的,调用他们只会被记录而不会被真正执行,只有遇到Actions,之前的Transformations才会被依次执行,这样的Delay Scheduling, 阅读全文
摘要:
但是在hive中查询是可以的。 后来经过一点一点测试发现,原来分区名称不能是大写,必须小写才行。 阅读全文
摘要:
我在service1模块里依赖了common模块,开发的时候包都能正常引用到,启动也能正常测试访问,可是奇怪的是,当我要打包成jar包时,就提示service1里依赖common的包都不存在,之前从没遇到过这种问题,有清楚这是什么原因造成的吗??? 进一步测试问题,初步发现问题 那就是在公共模块co 阅读全文
摘要:
thriftserver端口号10016 hdp所用端口号由10000改为10016 !connect jdbc:hive2://localhost:10016 阅读全文