瞌睡中的葡萄虎

博客园 首页 新随笔 联系 订阅 管理

2015年3月27日 #

摘要: 阅读全文
posted @ 2015-03-27 13:16 瞌睡中的葡萄虎 阅读(164) 评论(0) 推荐(0) 编辑

2015年3月24日 #

摘要: 今天测试过程中发现YARN Node变成Unhealthy了,后来定位到硬盘空间不够。。。。。通过查找大于100M的文件时发现有N多个spark-assembly-1.4.0-SNAPSHOT-hadoop2.5.0-cdh5.3.1.jar包,大小为170多M,每提交一个application到y... 阅读全文
posted @ 2015-03-24 16:22 瞌睡中的葡萄虎 阅读(833) 评论(0) 推荐(0) 编辑

2015年3月23日 #

摘要: CREATE TEMPORARY TABLE spark_tblsUSING org.apache.spark.sql.jdbcOPTIONS (url 'jdbc:mysql://hadoop000:3306/hive?user=root&password=root',dbtable ... 阅读全文
posted @ 2015-03-23 19:01 瞌睡中的葡萄虎 阅读(806) 评论(0) 推荐(0) 编辑

2015年3月18日 #

摘要: 在编译spark1.3.0时:export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"mvn clean package -DskipTests -Phadoop-2.4 -Dhadoop.versi... 阅读全文
posted @ 2015-03-18 17:57 瞌睡中的葡萄虎 阅读(1255) 评论(0) 推荐(0) 编辑

2015年3月12日 #

摘要: 启动hiveserver2:hiveserver2 --hiveconf hive.execution.engine=spark spark.master=yarn使用beeline连接hiveserver2:beeline -u jdbc:hive2://hadoop000:10000 -n sp... 阅读全文
posted @ 2015-03-12 18:18 瞌睡中的葡萄虎 阅读(2124) 评论(0) 推荐(0) 编辑

2015年3月11日 #

摘要: Hive现有支持的执行引擎有mr和tez,默认的执行引擎是mr,Hive On Spark的目的是添加一个spark的执行引擎,让hive能跑在spark之上;在执行hive ql脚本之前指定执行引擎、spark.home、spark.masterset hive.execution.engine=... 阅读全文
posted @ 2015-03-11 18:43 瞌睡中的葡萄虎 阅读(1674) 评论(0) 推荐(0) 编辑

2015年3月10日 #

摘要: Spark源码编译与环境搭建Note that you must have a version of Spark which does not include the Hive jars;Spark编译:git clone https://github.com/apache/spark.git sp... 阅读全文
posted @ 2015-03-10 18:03 瞌睡中的葡萄虎 阅读(3191) 评论(0) 推荐(0) 编辑

2015年3月4日 #

摘要: subtractReturn an RDD with the elements from `this` that are not in `other` . def subtract(other: RDD[T]): RDD[T]def subtract(other: RDD[T], numParti... 阅读全文
posted @ 2015-03-04 16:17 瞌睡中的葡萄虎 阅读(1331) 评论(0) 推荐(0) 编辑

2015年3月3日 #

摘要: Hive中已经存在emp和dept表:select * from emp;+--------+---------+------------+-------+-------------+---------+---------+---------+| empno | ename | job ... 阅读全文
posted @ 2015-03-03 15:41 瞌睡中的葡萄虎 阅读(1914) 评论(0) 推荐(0) 编辑

2015年2月9日 #

摘要: order_created.txt 订单编号 订单创建时间10703007267488 2014-05-01 06:01:12.334+0110101043505096 2014-05-01 07:28:12.342+0110103043509747 2014-05-01 07:50:12.... 阅读全文
posted @ 2015-02-09 15:05 瞌睡中的葡萄虎 阅读(1976) 评论(0) 推荐(0) 编辑