11 2016 档案

摘要:```java package cn.xingoo.learn.commons; import org.apache.commons.io.FileUtils; import org.apache.commons.io.filefilter.DirectoryFileFilter; import org.apache.commons.io.filefilter.FileFileFilter; i... 阅读全文
posted @ 2016-11-30 22:53 xingoo 阅读(9283) 评论(0) 推荐(1) 编辑
摘要:最近工作遇到一个需求,需要下载excel模板,编辑后上传解析存储到数据库。因此为了更好的理解公司框架,我就自己先用spring mvc实现了一个样例。 基础框架 之前曾经介绍过一个最简单的spring mvc的项目如何搭建, "传送门在这里" 。 这次就基于这个工程,继续实现上传下载的小例子。需要做 阅读全文
posted @ 2016-11-27 19:22 xingoo 阅读(10193) 评论(0) 推荐(0) 编辑
摘要:Sqoop通过 split by指定切分的字段, m设置mapper的数量。通过这两个参数分解生成m个where子句,进行分段查询。因此sqoop的split可以理解为where子句的切分。 第一步,获取切分字段的MIN()和MAX() 为了根据mapper的个数切分table,sqoop首先会执行 阅读全文
posted @ 2016-11-23 22:29 xingoo 阅读(5494) 评论(0) 推荐(0) 编辑
摘要:Sqoop的使用应该是Oozie里面最常用的了,因为很多BI数据分析都是基于业务数据库来做的,因此需要把mysql或者oracle的数据导入到hdfs中再利用mapreduce或者spark进行ETL,生成报表信息。 因此本篇的Sqoop Action其实就是运行一个sqoop的任务而已。 同样ac 阅读全文
posted @ 2016-11-22 21:46 xingoo 阅读(3883) 评论(0) 推荐(1) 编辑
摘要:Oozie在执行sqoop的时候报错,同样的SQL在sqoop中可用,在oozie中不可用: 原因,在使用left join的时候使用了别名。而split by字段,没有指定别名。 至于为什么在sqoop中好使,这个有时间看看源码吧。 另外,Oozie在使用时间字段进行split by的时候也会报错 阅读全文
posted @ 2016-11-21 22:55 xingoo 阅读(1273) 评论(0) 推荐(0) 编辑
摘要:![](http://images2015.cnblogs.com/blog/449064/201611/449064-20161120015824310-1455941712.png) 阅读全文
posted @ 2016-11-20 01:59 xingoo 阅读(1492) 评论(3) 推荐(2) 编辑
摘要:继前一篇大体上翻译了Email的Action配置,本篇继续看一下Shell的相关配置。 Shell Action Shell Action可以执行Shell脚本命令,工作流会等到shell完全执行完毕后退出,再执行下一个节点。为了运行shell,必须配置 以及 ,并且设置 来执行shell. She 阅读全文
posted @ 2016-11-19 00:20 xingoo 阅读(4776) 评论(1) 推荐(0) 编辑
摘要:在大数据的当下,各种spark和hadoop的框架层出不穷。各种高端的计算框架,分布式任务如乱花般迷眼。你是否有这种困惑!——有了许多的分布式任务,但是每天需要固定时间跑任务,自己写个调度,既不稳定,又没有可靠的通知。 想要了解 "Oozie的基础知识,可以参考这里" 那么你应该是在找——Oozie 阅读全文
posted @ 2016-11-17 21:53 xingoo 阅读(4306) 评论(0) 推荐(0) 编辑
摘要:使用ES的基本都会使用过head,但是版本升级到5.0后,head插件就不好使了。下面就看看如何在5.0中启动Head插件吧! Head目前支持5.0了!请不要看本篇文章了 Head目前支持5.0了!请不要看本篇文章了 Head目前支持5.0了!请不要看本篇文章了 Head目前支持5.0了!请不要看 阅读全文
posted @ 2016-11-04 14:52 xingoo 阅读(45675) 评论(18) 推荐(3) 编辑

点击右上角即可分享
微信分享提示