上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 19 下一页
摘要: 报错日志: java.lang.IllegalStateException: File name has been re-used with different files. Spooling assumptions violated for /usr/local/data/flumedata/wo 阅读全文
posted @ 2019-12-24 22:04 Xiaohu_BigData 阅读(1085) 评论(0) 推荐(0) 编辑
摘要: 在使用之前,提供一个大致思想,使用Flume的过程是确定scource类型,channel类型和sink类型,编写conf文件并开启服务,在数据捕获端进行传入数据流入到目的地。 实例一、从控制台打入数据,在控制台显示 1、确定scource类型,channel类型和sink类型 确定的使用类型分别是 阅读全文
posted @ 2019-12-24 21:59 Xiaohu_BigData 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 在使用之前,先介绍组件Flume的特点和一些组件 Flume的优势: 1. Flume可以将应用产生的数据存储到任何集中存储器中,比如HDFS,HBase 2. 当收集数据的速度超过将写入数据的时候,也就是当收集信息遇到峰值时,这时候收集的信息非常大,甚至超过了系统的写入数据能力,这时候,Flume 阅读全文
posted @ 2019-12-24 21:05 Xiaohu_BigData 阅读(660) 评论(0) 推荐(0) 编辑
摘要: Flume架构介绍和安装 写在前面在学习一门新的技术之前,我们得知道了解这个东西有什么用?我们可以使用它来做些什么呢?简单来说,flume是大数据日志分析中不能缺少的一个组件,既可以使用在流处理中,也可以使用在数据的批处理中。1.流处理:2.离线批处理:分析:不管你是数据的实时流处理,还是数据的离线 阅读全文
posted @ 2019-12-24 20:45 Xiaohu_BigData 阅读(307) 评论(0) 推荐(0) 编辑
摘要: cd /optvi test.sh #!/bin/bash datetime=(date′+source/etc/profilehive−e"loaddatalocalinpath′/opt/datame.txt′intotableshujuku.tablenamepartition(dt 阅读全文
posted @ 2019-12-24 14:03 Xiaohu_BigData 阅读(593) 评论(0) 推荐(0) 编辑
摘要: hive脚本的执行方式 hive脚本的执行方式大致有三种: hive控制台执行; hive -e "SQL"执行; hive -f SQL文件执行;参考hive用法: usage: hive -d,--define <key=value> Variable subsitution to apply 阅读全文
posted @ 2019-12-23 22:50 Xiaohu_BigData 阅读(1401) 评论(0) 推荐(0) 编辑
摘要: 当我们进入企业就会发现,很多时候,企业的数据都是加密的,我们拿到的数据没办法使用Hive自带的函数去解决,我们就需要自己去定义函数去查看,哈哈,然而企业一般不会将解密的代码给你的,只需要会用,但是我们也需要知道怎么去实现。 1、打开编译器,我使用的myEclipse, 在maven项目中添加依赖 < 阅读全文
posted @ 2019-12-23 22:01 Xiaohu_BigData 阅读(566) 评论(0) 推荐(0) 编辑
摘要: 数据准备: 7369,SMITH,CLERK,7902,1980-12-17,800,null,20 7499,ALLEN,SALESMAN,7698,1981-02-20,1600,300,30 7521,WARD,SALESMAN,7698,1981-02-22,1250,500,30 7566 阅读全文
posted @ 2019-12-23 20:54 Xiaohu_BigData 阅读(556) 评论(0) 推荐(0) 编辑
摘要: Hive实现按照指定格式输出每七天的消费平均数 数据准备 2018/6/1,10 2018/6/2,11 2018/6/3,11 2018/6/4,12 2018/6/5,14 2018/6/6,15 2018/6/7,13 2018/6/8,37 2018/6/9,18 2018/6/10,19 阅读全文
posted @ 2019-12-23 20:15 Xiaohu_BigData 阅读(1776) 评论(1) 推荐(2) 编辑
摘要: Hive实现WordCount计数 在没学习Hive之前,我们学习MapReduce去实现WordCount计数的时候,就要去编写80多行的java代码,现在我们学习了Hive,我们只需要一行Sql语句就可以实现。 准备数据 在hive中创建表 使用本地导入的命令进行导入数据 select 查看一下 阅读全文
posted @ 2019-12-23 19:44 Xiaohu_BigData 阅读(475) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 19 下一页