摘要:
参考文档:http://lxw1234.com/archives/2015/08/473.htm 一、元表结构 1、定义业务库原始订单表: drop table chavin.orders; CREATE TABLE orders ( orderid INT, createtime STRING, 阅读全文
摘要:
一、hive中实现方法 基表: 组表: gt gid gname 1001 g1 1002 g2 1003 g3 create table g( gid int, gname string )row format delimited fields terminated by '\t' stored 阅读全文
摘要:
测试数据: SQL> select * from sscore; NAME SCORE aa 99 bb 56 cc 56 dd 77 ee 78 ff 76 gg 78 ff 50 8 rows selected 针对以上表,需要按成绩进行排序,从而取得名次信息: 实现方法一:分析函数 SQL> 阅读全文
摘要:
题目: 一组通话记录(总共500万条):ID 主叫号码 被叫号码 通话起始时间 通话结束时间 通话时长1 98290000 0215466546656 2007-02-01 09:49:53.000 2007-02-01 09:50:16.000 232 98290000 021546654666 阅读全文
摘要:
示例1:测试数据:SQL> select * from score; ID CLASS STUDENT COURSE SCORE---------- ----- ------- ------ ---------- 1 一 张三 数学 90 2 一 张三 语文 89 3 一 李四 数学 ... 阅读全文
摘要:
准备测试数据: create table test01( groupid number, a number, b number, c number ); insert into test01 values(1,2,3,4); insert into test01 values(1,2,6,4); i 阅读全文
摘要:
自从学习数据仓库以来,对数据仓库“面向主题”的概念始终比较模糊,理解不够深刻、透彻。 昨天晚上翻开课本温习一下,仍然不能领悟其本质思想、很是困惑,后来从网上找了一些资料,细细着磨一下。1.主题的概念主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。例如... 阅读全文
摘要:
今天将临时表里面的数据按照天分区插入到线上的表中去,出现了Hive创建的文件数大于100000个的情况,我的SQL如下:hive> insert overwrite table test partition(dt)> select * from iteblog_tmp;iteblog_tmp表里面一共有570多G的数据,一共可以分成76个分区,SQL运行的时候创建了2163个Mapper,0个... 阅读全文
摘要:
在进行报表开发时,很多时候会遇到行列转换操作,很对开发人员针对于SQL级别行列转换操作一直不甚理解,今天正好抽空对其进行了一些简单的总结。这里主要列举3种可以实现SQL行列转换的方法,包括通用SQL解法以及Oracle支持解法。 一、测试数据 测试表依旧采用Oracle经典的scott模式下的dep 阅读全文
摘要:
一、配置防火墙CentOS 7.0默认使用的是firewall作为防火墙,这里改为iptables防火墙。1、关闭firewall:systemctl stop firewalld.servi(www.111cn.net)ce #停止firewallsystemctl disable firewalld.service #禁止firewall开机启动2、安装iptables防火墙yum insta... 阅读全文