摘要:
Hive 中的wordCount详解、split()、explode()、posexplode()、通过起别名的方式接收函数处理字段之后生成的新附加字段 因为指定的列分割符是 | 所以数据并不会被分割,而且表中只定义了一个字段 所以每一行数据会作为这个字段的一条记录 然后通过split()将数据按照 阅读全文
摘要:
Hive 中的wordCount、Hive 开窗函数 Hive 中的wordCount create table words( words string )row format delimited fields terminated by '|'; // 数据 hello,java,hello,ja 阅读全文
摘要:
Hive练习题20道及解题过程、开发中的常见问题和细节 开发中的常见问题和细节 distinct -- 去重 可以放在select后面,表示所有字段的去重 也可以放在聚合函数中,表示对函数中的字段去重 Hive中where条件不支持不等式的子查询,可以通过join实现 select … from 表 阅读全文
摘要:
Hive 常用函数 [一起学Hive]之二–Hive函数大全-完整版 – lxw的大数据田地 (lxw1234.com) hive 常用函数大全 关系运算 常用在where条件中 // 等值比较 = == <=> // 不等值比较 != <> // 区间比较: select * from defau 阅读全文
摘要:
SQL练习 1、count(*)、count(1) 、count('字段名') 区别 2、HQL 执行优先级: from、where、 group by 、having、order by、join、select 、limit 3、where 条件里不支持不等式子查询,实际上是支持 in、not in 阅读全文
摘要:
nohup 和 & -- 后台运行 nohup 不挂断地运行命令 & 是指在后台运行 --例如 nohup 命令 & --表示不挂断的后台运行命令 processon.com -- 免费在线流程图思维导图 Markdown 基本语法 | Markdown 官方教程 Markdown语法大全(超级版) 阅读全文
摘要:
通过查看运行日志来找出错误原因 一般在程序 logs 目录下,然后通过 tail 命令查看 tail -n 200 日志文件名 # -n 表示显示200行 关于换行符 /r 、/n 、/r/n \r -- 回车 \n -- 换行 在Linux系统中 -- \n 在Windows系统中 -- \r\n 阅读全文
摘要:
通过rz实现Xftp的功能 yum install lrzsz 安装完毕之后就可以直接拖文件进Linux了 如何查看该进程是什么进程 ps -aux | grep 进程号 Hive的架构图 Hive的8道小练习 #写在hive中的SQL最好都要带上limit,因为是大数据嘛 #如果有分组,那么sel 阅读全文
摘要:
我们的版本约定 JAVA_HOME=/usr/local/soft/jdk1.8.0_171 HADOOP_HOME=/usr/local/soft/hadoop-2.7.6 HIVE_HOME=/usr/local/soft/hive-1.2.1 安装Hive #前提是:mysql和hadoop必 阅读全文
摘要:
操作Hive的方式、Hive的元数据和数据的存储位置、Hive中元数据的组成 Hive的metastore(元数据) 阅读全文