摘要: 在Ubuntu14.04下安装Hadoop2.4.0 (单机模式)基础上配置 一、配置core-site.xml /usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。 编辑器中打开此文件 sudo gedit /usr/local 阅读全文
posted @ 2016-06-14 14:44 Lio5n 阅读(929) 评论(0) 推荐(0) 编辑
摘要: 一、在Ubuntu下创建hadoop组和hadoop用户 增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。 1、创建hadoop用户组 2、创建hadoop用户 sudo adduser -ingroup hadoop hadoop 回车后会 阅读全文
posted @ 2016-06-14 14:41 Lio5n 阅读(1755) 评论(0) 推荐(0) 编辑
摘要: 1. 笛卡儿积 2. 内连接 3. 左外连接 4. 右外连接 5. 全外连接 6. USING 7. NATURAL 阅读全文
posted @ 2016-06-01 14:29 Lio5n 阅读(208) 评论(0) 推荐(0) 编辑
摘要: 学习了一段时间birt,发现每一个报表都要设置数据源,这样以后要是改动了,数据库的链接,那样每个报表的数据源都要更改,那样工作量是很大的,研究了下发现可以使用公用library的可以很好的解决这个问题。 1、点击eclipse的新建,里面可以发现有个library,点击新建library库,起名ds 阅读全文
posted @ 2016-05-18 10:56 Lio5n 阅读(924) 评论(0) 推荐(0) 编辑
摘要: 一、新建项目,用于报表文件的存放: 点击文件-新建-other-报表项目,然后点击下一步,如图 二、新建报告,创建第一张报表:在上面创建的项目文件夹上右键,新建-报告-空白报表,点击完成。 三、在空白报表上编辑您的报表: 在该空白报表上输入文字和图片等静态内容,然后点击下方的预览即可以查看您报表的效 阅读全文
posted @ 2016-03-28 15:51 Lio5n 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 方法一: 到Eclipse的官方网站[download.eclipse.org]去下载 BIRT 插件(birt-report-designer-all-in-one-2_1_1),解压后,它就是一个拥有 BIRT插件的Eclipse。如果你已经安装了Eclipse,那么把下载的文件夹的内容拷到所对 阅读全文
posted @ 2016-03-28 15:45 Lio5n 阅读(2781) 评论(0) 推荐(0) 编辑
摘要: 首先声明本人不懂Java,只是从执行结果推测Kettle的处理机制,有不对的地方,还请多多指教。据我推测:SQL对数据的处理是批量处理的,而Kettle对数据的处理是逐行处理的。先理解一下meger(合并)和join(连接),假设A表两个字段,B表两个字段meger: 结果为两个字段。join: 结... 阅读全文
posted @ 2016-01-09 16:51 Lio5n 阅读(1386) 评论(0) 推荐(0) 编辑
摘要: 总感觉以下的做法不太合适,要用到result,如果大家有更好的改变variable的方法,请指教,谢谢!job如下:设置变量的trans如下:获取初始变量的trans:变量+1的trans:循环执行的trans: 阅读全文
posted @ 2016-01-02 13:18 Lio5n 阅读(1303) 评论(0) 推荐(0) 编辑
摘要: job如下图:设置result的trans:result+1的trans:循环执行的trans: 阅读全文
posted @ 2016-01-02 13:08 Lio5n 阅读(587) 评论(0) 推荐(0) 编辑
摘要: 先看一下job如下:在看一下设置循环条件的trans(图片里一个字写错了,大家不要在乎这些细节):再看一下循环执行的trans:最后最重要的看一下job里循环执行的trans的设置:执行结果如下: 阅读全文
posted @ 2016-01-02 04:31 Lio5n 阅读(1223) 评论(0) 推荐(0) 编辑