瞌睡中的葡萄虎

博客园 首页 新随笔 联系 订阅 管理

2014年8月6日 #

摘要: Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。将数据从ORACLE中抽取数据,经过hive进行分析转换,最后存放到ORACLE中去。本案例是纯demo级别,练手使用一、需求将emp和dept表的数据分析最后存放到result表。emp和de... 阅读全文
posted @ 2014-08-06 18:01 瞌睡中的葡萄虎 阅读(2735) 评论(0) 推荐(0) 编辑

摘要: 示例数据准备hive中创建dept表create table dept(deptno int,dname string,loc string)row format delimited fields terminated by '\t' lines terminated by '\n' stored ... 阅读全文
posted @ 2014-08-06 17:35 瞌睡中的葡萄虎 阅读(3197) 评论(0) 推荐(0) 编辑

摘要: 导入表的所有字段sqoop import --connect jdbc:oracle:thin:@192.168.1.107:1521:ORCL \--username SCOTT --password tiger \--table EMP \--hive-import --create-hive... 阅读全文
posted @ 2014-08-06 17:23 瞌睡中的葡萄虎 阅读(1938) 评论(0) 推荐(0) 编辑

摘要: 注意:在导出前需要先创建待导出的表结构。如果导出的表在数据库中不存在则会报错;如果重复导出多次,表中的数据会重复;create table EMP_DEMO as select * from EMP where 1=2;create table SALGRADE_DEMO as select * f... 阅读全文
posted @ 2014-08-06 16:30 瞌睡中的葡萄虎 阅读(4588) 评论(0) 推荐(0) 编辑

摘要: 导入表的所有字段sqoop import --connect jdbc:oracle:thin:@192.168.1.100:1521:ORCL \--username SCOTT --password tiger \--table EMP -m 1;查看执行结果:hadoop fs -cat /u... 阅读全文
posted @ 2014-08-06 15:57 瞌睡中的葡萄虎 阅读(5683) 评论(0) 推荐(0) 编辑

摘要: sqoop产生背景多数是用Hadoop技术处理大数据业务的企业有大量的数据存储在传统的关系型数据库(RDBMS)中;由于缺乏工具的支持、对Hadoop和传统数据库系统中的数据进行相互传输是一件十分困难的事情;Sqoop就是一个在RDBMS和Hadoop之间进行数据传输的项目;sqoop概述sqoop... 阅读全文
posted @ 2014-08-06 15:34 瞌睡中的葡萄虎 阅读(606) 评论(0) 推荐(0) 编辑