摘要: http://wiki.pentaho.com/display/BAD/Loading+Data+into+HBase 1)下载样本文件 到官网去下载 2)Hbase中建表 3)创建转换 3)配置Text file Input 5)配置content和Fields 6)添加HBase Output 阅读全文
posted @ 2016-07-30 23:04 派。 阅读(1762) 评论(0) 推荐(0) 编辑
摘要: http://wiki.pentaho.com/display/BAD/Extracting+Data+from+HBase+to+Load+an+RDBMS 1)新建转换——Big Data——Hbase Input双击打开 2)在hbase中创建表 3)点击Get table names 4)创 阅读全文
posted @ 2016-07-30 22:59 派。 阅读(2787) 评论(0) 推荐(1) 编辑
摘要: 1.hive往外写数据 http://wiki.pentaho.com/display/BAD/Extracting+Data+from+Hive+to+Load+an+RDBMS 连接hive 表输入 1)往excel中写数据 2)往文本文件中写数据 注:这里需要填上hive的表名.字段名,不然会 阅读全文
posted @ 2016-07-30 22:56 派。 阅读(4966) 评论(0) 推荐(0) 编辑
摘要: http://wiki.pentaho.com/display/BAD/Loading+Data+into+HDFS 新建job 双击hadoop copy files File/Folder source 下一个目标目录 点击 点击add 执行 已写入数据 阅读全文
posted @ 2016-07-30 22:51 派。 阅读(474) 评论(0) 推荐(0) 编辑
摘要: 工具中找资源库或者CTRL+R 点+号 再点新建 把sql中的’N’改成FALSE或’0’,’Y’改成TRUE或’1’。或者把sql直接考出来到mysql命令行执行。 创建资源库成功。 阅读全文
posted @ 2016-07-30 22:48 派。 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 在xmanager中的xshell运行进入图形化界面 新建一个job 1.往hdfs中写数据 1)linux中kettle往hdfs中写数据 双击hadoop copy files 运行此job 查看数据: 1)windows中kettle往hdfs中写数据 Windows中往power服务器中hd 阅读全文
posted @ 2016-07-30 22:45 派。 阅读(2131) 评论(0) 推荐(0) 编辑
摘要: Hadoop集群硬件环境 4台机器 每台内存16G 8核cpu 直接使用报错: not yet support! 1.修改配置 data-integration/libswt/linux/ppc64le下放入swt.jar 下载地址: http://archive.eclipse.org/eclip 阅读全文
posted @ 2016-07-30 22:35 派。 阅读(375) 评论(0) 推荐(0) 编辑
摘要: 官方Hadoop配置 http://wiki.pentaho.com/display/BAD/Configuring+Pentaho+for+your+Hadoop+Distro+and+Version 1.官网下载kettle http://community.pentaho.com/projec 阅读全文
posted @ 2016-07-30 13:53 派。 阅读(3256) 评论(0) 推荐(0) 编辑