Processing math: 100%

05 2018 档案

摘要:一、over(partition by ......)主要和聚合函数sum()、count()、avg()等结合使用,实现分组聚合的功能 示列:根据day_id日期和mac_id机器码进行聚合分组求每一天的该机器的销量和即sum_num,hive sql语句:select day_id,mac_id 阅读全文
posted @ 2018-05-28 22:24 0xcafedaddy 阅读(8256) 评论(0) 推荐(0) 编辑
摘要:Hive提供三种可以改变环境变量的方法,分别是:(1)、修改HIVEHOME/conf/hivesite.xml23cliHive{HIVE_HOME}/conf/h 阅读全文
posted @ 2018-05-25 10:57 0xcafedaddy 阅读(1456) 评论(0) 推荐(0) 编辑
摘要:1、UNION用的比较多 语法如下: select employee_id,job_id from employees union select employee_id,job_id from job_history 2、union all是直接连接,取到得是所有值,记录可能有重复。 语法如下: s 阅读全文
posted @ 2018-05-19 14:43 0xcafedaddy 阅读(138) 评论(0) 推荐(0) 编辑
摘要:删除文件并放入回收站: hdfs dfs -rm -f /path 删除文件不放入回收站: hdfs dfs -rm -f -skipTrash /path 清空回收站: hdfs dfs -expunge (执行完之后会打一个checkpoint,并不会立即执行,稍后会执行清空回收站操作) 阅读全文
posted @ 2018-05-17 11:48 0xcafedaddy 阅读(7722) 评论(0) 推荐(0) 编辑
摘要:java -jar xx.jar -Dspring.config.location=/data/apps/xx/application-prod.properties 阅读全文
posted @ 2018-05-14 13:11 0xcafedaddy 阅读(261) 评论(0) 推荐(0) 编辑
摘要:引入本地jar包: 阅读全文
posted @ 2018-05-10 16:06 0xcafedaddy 阅读(2019) 评论(0) 推荐(0) 编辑
摘要:为什么会出现依赖冲突 首先要说明Maven的依赖管理,具体的可以参考这边 Maven学习——依赖管理 这篇文章,maven在依赖冲管理中有一下几个原则。 依赖是使用Maven坐标来定位的,而Maven坐标主要由GAV(groupId, artifactId, version)构成。如果两个相同的依赖 阅读全文
posted @ 2018-05-10 01:59 0xcafedaddy 阅读(1606) 评论(0) 推荐(0) 编辑
摘要:在使用update语句的时候我们有时候需要利用left join 关联表,以下是正确操作: 效果,让指定的order表id为1,2,3数据的finish_at字段更新为freports表的created_at字段 load data local infile '/Users/k/Desktop/ta 阅读全文
posted @ 2018-05-08 20:38 0xcafedaddy 阅读(6008) 评论(0) 推荐(0) 编辑
摘要:Quartz提供两种基本作业存储类型 >第一种类型叫做RAMJobStore: 最佳的性能,因为内存中数据访问最快 不足之处是缺乏数据的持久性,当程序路途停止或系统崩溃时,所有运行的信息都会丢失 >第二种类型叫做JDBC作业存储: 通过调整其quartz.properties属性文件,持久化任务调度 阅读全文
posted @ 2018-05-06 19:09 0xcafedaddy 阅读(618) 评论(0) 推荐(0) 编辑
摘要:1.前言 本文主要是对这两篇blog的整理,感谢作者的分享 Spring使用程序方式读取properties文件 Spring通过@Value注解注入属性的几种方式 2.配置文件 application.properties socket.time.out=1000 3.使用spring代码直接载入 阅读全文
posted @ 2018-05-06 18:31 0xcafedaddy 阅读(1376) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示