会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
waker_wang
博客园
|
首页
|
新随笔
|
新文章
|
联系
|
订阅
|
管理
上一页
1
2
3
4
5
下一页
2018年8月15日
大数据小项目之电视收视率企业项目12
摘要: 因为环境不足,所以没有用flume收集日志,而是用的已经从别的渠道的日志 日志截图: 编写以下脚本,将收集的日志文件上传至HDFS MR清洗数据 创建工程导入依赖库: Mapper类 Driver类 打jar包 上传jar包到虚拟机,执行命令 hadoop jar /home/wang/mrclic
阅读全文
posted @ 2018-08-15 09:50 waker_wang
阅读(406)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目11
摘要: sqoop数据迁移 概述 sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。 导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统; 导出数据:从Hadoop的文件系统中导出数据到关系数据库 工作机制 将导入或导出
阅读全文
posted @ 2018-08-15 09:08 waker_wang
阅读(350)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目10
摘要: Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 Agent主要由:source,channel,sink三个组
阅读全文
posted @ 2018-08-15 08:58 waker_wang
阅读(450)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目09--hive环境搭建
摘要: Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,总归为大数据,并使得查询和分析方便。并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 术语“大数据”是大型数据集,其中包括体积庞大,高速,以及各种由与日俱增的数据的集合。使用
阅读全文
posted @ 2018-08-15 08:47 waker_wang
阅读(322)
评论(0)
推荐(0)
编辑
2018年8月14日
spark入门: wordcount-java
摘要: wordcount-java: pom.xml文件如下:
阅读全文
posted @ 2018-08-14 22:49 waker_wang
阅读(320)
评论(0)
推荐(0)
编辑
转发一个关于下载qq无损音乐的博客
摘要: 直接考copy就能成功下载了 https://www.52pojie.cn/thread-767941-1-1.html(转发网址)
阅读全文
posted @ 2018-08-14 14:03 waker_wang
阅读(1680)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目08--》MapReduce编写之Wordcount
摘要: 编程规范 (1)用户编写的程序分成三个部分:Mapper,Reducer,Driver(提交运行mr程序的客户端) (2)Mapper的输入数据是KV对的形式(KV的类型可自定义) (3)Mapper的输出数据是KV对的形式(KV的类型可自定义) (4)Mapper中的业务逻辑写在map()方法中
阅读全文
posted @ 2018-08-14 13:23 waker_wang
阅读(186)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目07
摘要: maven搭建(前提是在你的Windows电脑上有Java,并且能用) 下图为maven官网(http://maven.apache.org/) 安装 Maven 之前要求先确定你的 JDK 已经安装配置完成。Maven是 Apache 下的一个项目,我用的是3.5.2。 使用本地的maven环境
阅读全文
posted @ 2018-08-14 13:11 waker_wang
阅读(158)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目06
摘要: hadoop常用的命令 hdfs dfs -mkdir -p /user/wang/hadoop 递归创建目录 hdfs dfs -ls /user 查看/user下内容 hdfs dfs -ls -R /user 递归查看 hdfs dfs -help put hdfs dfs -put inde
阅读全文
posted @ 2018-08-14 12:56 waker_wang
阅读(148)
评论(0)
推荐(0)
编辑
大数据小项目之电视收视率企业项目05
摘要: 通过hadoop自带的demo运行单词统计(测试) 在家目录下操作: 执行结果截图:
阅读全文
posted @ 2018-08-14 12:51 waker_wang
阅读(213)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
下一页
公告