2017 年 3月随笔档案 - 松伯

03 2017 档案

摘要：1、数据查询 //提高聚合的性能 SET hive.map.aggr=true; SELECT count(*),avg(salary) FROM employees; //木匾不允许在一个查询语句中使用多于一个的函数（DISTINCT。。。）表达式 SELECT count(DISTINCT sy 阅读全文

posted @ 2017-03-19 16:19 松伯阅读(558) 评论(0) 推荐(0) 编辑

hiveql笔记（一）

摘要：1、创建表 create table if not exists mydb.employees{ name String COMMENT 'Employee name', salary FLOAT COMMENT 'Empolyee salary', subordinates APPAY<STRIN 阅读全文

posted @ 2017-03-19 12:00 松伯阅读(474) 评论(0) 推荐(0) 编辑

hdfs文件按修改时间下载

摘要：应用于：对于不同用户创建的表目录，进行文件的下载，程序中执行hadoop cat命令下载文件到本地，随后通过ftp传至目标服务器，并将hdfs文件目录的修改时间存入mysql中。每次修改前将mysql中记录的数据，与本批次下载的HDFS文件路径修改时间对比，如果改变，则决定是否下载文件：入口：阅读全文

posted @ 2017-03-06 16:32 松伯阅读(518) 评论(0) 推荐(0) 编辑

2025年3月

日

一

二

三

四

五

六

搜索

常用链接

随笔分类 (236)

随笔档案 (232)

阅读排行榜

评论排行榜

推荐排行榜

最新评论