摘要: Pig 阅读全文
posted @ 2016-05-05 14:04 yuerspring 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 大数据技术可视化之Hue 阅读全文
posted @ 2016-05-05 14:01 yuerspring 阅读(242) 评论(0) 推荐(0) 编辑
摘要: kylin & tableauhive 就是字面意思,大型数据仓库,这边用了一个叫kylin 的东西 从hive 取数据生成cube 以key value 的方式存在hbase 里面 。hbase 对接tableau 等报表工具 Hbase 中 Cube 存的是... 阅读全文
posted @ 2016-05-05 10:33 yuerspring 阅读(691) 评论(0) 推荐(0) 编辑
摘要: 大数据技术之R 阅读全文
posted @ 2016-05-05 10:31 yuerspring 阅读(87) 评论(0) 推荐(0) 编辑
摘要: truncate table DWDM2.tablename IMMEDIATE;alter table DWDM1.tablename activate not logged initially with empty table;but which one is... 阅读全文
posted @ 2016-05-04 20:16 yuerspring 阅读(696) 评论(0) 推荐(0) 编辑
摘要: select num, listagg(DSCR, ',') WITHIN GROUP(ORDER BY DSCR) as DSCRfrom DWDM2.QUOTE_TEMP where DSCR != 'E0003' group by num with ... 阅读全文
posted @ 2016-05-04 08:16 yuerspring 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 大数据技术Hive 调用的常用方式 Hive -e ‘sql’Hive -f 'file.name'Java jdbc Hive 是目前hadoop 系统中最重要的工具 ,请参考stuq 的IT 图谱 :https://github.com/TeamStuQ/ski... 阅读全文
posted @ 2016-05-03 22:59 yuerspring 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 大数据技术 Hbase 在大数据领域能够扮演什么角色 ?在数据仓库中 ?日常工作中 ? have no idea 阅读全文
posted @ 2016-05-03 22:58 yuerspring 阅读(94) 评论(0) 推荐(0) 编辑
摘要: Storm 是一个分布式的 ,容错的实时计算系统Storm 实时 低延迟 ,主要有两个原因 :1 storm 进程是常驻内存的,没有hadoop 里面的不断的起停2 storm 的数据是不经过磁盘的,都是在内存里面的,处理完成就没有了,数据的交换经过网络,没有磁盘IO... 阅读全文
posted @ 2016-05-03 22:58 yuerspring 阅读(750) 评论(0) 推荐(0) 编辑
摘要: 大数据技术 阅读全文
posted @ 2016-05-03 22:55 yuerspring 阅读(119) 评论(0) 推荐(0) 编辑