1

 

大数据项目:新闻日志大数据处理系统

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xw15061126063/article/details/86760299

Big-Data-Project

Hadoop2.x、Zookeeper、Flume、Hive、Hbase、Kafka、Spark2.x、SparkStreaming、MySQL、Hue、J2EE、websoket、Echarts

项目名称:新闻日志大数据处理系统

项目简介

github开源
源码:https://github.com/changeforeda/Big-Data-Project
目标

1、完成大数据项目的架构设计,安装部署,架构继承与开发、用户可视化交互设计

2、完成实时在线数据分析

3、完成离线数据分析

具体功能

1)捕获用户浏览日志信息

2)实时分析前20名流量最高的新闻话题

3)实时统计当前线上已曝光的新闻话题

4)统计哪个时段用户浏览量最高

5)报表

项目技术点

Hadoop2.x、Zookeeper、Flume、Hive、Hbase

Kafka、Spark2.x、SparkStreaming

MySQL、Hue、J2EE、websoket、Echarts

开发工具

虚拟机: VMware、centos

虚拟机ssh: SecureCRT(在windows上链接多个虚拟机)

修改源码:idea

查看各种数据:notepad++(安装NppFTP插件,修改虚拟机中配置文件,好用的一批)

所有软件下载地址:

链接:https://pan.baidu.com/s/1aF_VmdXJVIjeB0WzAtfeEQ

提取码:cuao

项目架构

图片来自于卡夫卡公司

集群资源规划

利用VMware虚拟机+centos完成,基本要求笔记本电脑内存在8G以上。
最低要去克隆出3台虚拟机,每台给2G内存。

项目实现步骤

1、第一章:项目需求分析与设计

https://www.willxu.xyz/2018/12/19/project/1、项目需求/

2、第二章:linux环境准备与设置

https://www.willxu.xyz/2018/12/19/project/2、linux配置/

3、第三章:Hadoop2.X分布式集群部署

https://www.willxu.xyz/2018/12/19/project/3、hadoop部署/

4、第四章:Zookeeper分布式集群部署

https://www.willxu.xyz/2018/12/29/project/4、zk部署/

5、第五章:hadoop的高可用配置(HA)

https://www.willxu.xyz/2018/12/29/project/5、ha实现/

6、第六章:hadoop的HA下的高可用HBase部署

https://www.willxu.xyz/2018/12/30/project/6、hbase部署/

7、第七章:Kafka简介和分布式部署

https://www.willxu.xyz/2019/01/01/project/7、kafka部署/

8、第八章:Flume简介和分布式部署

https://www.willxu.xyz/2019/01/01/project/8、flume部署/

9、第九章:Flume源码修改与HBase+Kafka集成

https://www.willxu.xyz/2019/01/20/project/9、flume-hbase-kfk配置/

10、第十章:Flume+HBase+Kafka集成全流程测试

https://www.willxu.xyz/2019/01/20/project/10、flume-hbase-kfk联调/

11、第十一章:mysql、Hive安装与集成

https://www.willxu.xyz/2019/01/22/project/11、mysql-hive/

12、第十二章:Hive与Hbase集成

https://www.willxu.xyz/2019/01/23/project/12、hive-hbase/

13、第十三章:Cloudera HUE大数据可视化分析

https://www.willxu.xyz/2019/01/26/project/13、hue/

14、第十四章:Spark2.X集群安装与spark on yarn部署

https://www.willxu.xyz/2019/01/30/project/14、spark on yarn/

15、第十五章:基于IDEA环境下的Spark2.X程序开发

https://www.willxu.xyz/2019/01/30/project/15、spark-idea/

16、第十六章:Spark Streaming实时数据处理

https://www.willxu.xyz/2019/02/03/project/16、spark-streaming1/

项目配套视频

链接:https://pan.baidu.com/s/1-PQta6SCgps91oFNTkl6Qg

提取码:sh8x

整理不易,打赏鼓励

微信

支付宝

打赏后,我们就是“好朋友”!

本月本地用户一定要看看!宁宇通顺-专业从事:各种大型...宁宇通顺装卸 · 顶新
 

大数据。基于Hbase的网站日志分析系统(附带web展示页面)

04-17
基于Hbase的网站日志分析系统(附带web展示页面) 基于Hbase的网站日志分析系统(附带web展示页面)基于Hbase的网站日志分析系统(附带web展示页面)
下载

大数据综合案例-网站日志分析

12-28
大数据综合案例-网站日志分析,主要是文档,使用大数据离线分析日志。
下载

大数据实时处理架构实践

01-05
基于Spark streaming 的实时系统架构:多个流的处理、持久化offset、离线纠正数据、快速失败重启,报警,人工介入、基于kafka-offset的无状态系统
下载
股市经典口诀,涨三不追,跌四不压… 赢百万身价 看完恍然大悟指.南针 · 顶新
逍遥子_关注
逍遥子_

 

312篇文章

排名:2000+

码动乾坤关注
码动乾坤

 

58篇文章

排名:千里之外

bug发现与制造关注
bug发现与制造

 

333篇文章

排名:5000+

大数据开发工程师关注
大数据开发工程师

 

38篇文章

排名:千里之外

大数据处理系统:Hadoop源代码情景分析.毛德操(带书签高清文字版).pdf

04-26
Hadoop是目前采用最广、最重要的一种开源的大数据处理平台,读懂Hadoop的源代码,深入理解其各种机理,对于掌握大数据处理的技术有着显而易见的重要性。 本书从大数据处理的原理开始,讲到Hadoop的由来,进而讲述对于代码的研究方法,然...
下载
股票“三不卖七不买“6字黄金口诀,只买井喷股 赢数百万身家!指.南针 · 顶新

《大数据处理系统:Hadoop源代码情景分析》┊毛德操 PDF

05-27
《大数据处理系统:Hadoop源代码情景分析》┊毛德操,带书签高清完整版PDF,仅供学习参考!
下载
陈小春哭诉:中关村土豪怒砸2亿请他代言这款0充值正版传奇!真经典!贪玩游戏 · 顶新

大数据项目一电商平台下的日志分析08

阅读数 2298

详细内容见文档博文来自: yangshaojun1992的博客

陈小春哭诉:中关村土豪怒砸2亿请他代言这款0充值正版传奇!真经典!贪玩游戏 · 顶新

基于Flume+Kafka+Spark-的分布式日志流处理系统的设计与实现

05-14
基于FlumeKafkaSpark-的分布式日志流处理系统的设计与实现
下载
动植物仿真,亘古带你体验真实大自然亘古龙腾 · 顶新

基于大数据的视频智能分析系统的应用

06-20
大数据技术在营销、金融等行业用来分析客户行为指导精准营销,已经取得了广泛成功。但是在视频监控领域应用发展十分迟缓,其主要原因就是视频监控领域的核心数据是视频是非结构化数据,无法直接使用成熟的大数据软件进行分析处理。对此,首先对大数据技术进...
下载
人人竟然都不知道!宁宇通顺-专业从事:各种大型设备的起...宁宇通顺装卸 · 顶新

大数据日志可视化demo

04-04
这是一个基于flume采集日志kafka消息传输,使用spark将日志划分等级将日志发送到不同级别的管理人员那里,同时将日志实时传送至web页面进行展示
下载
 
 
 

python 给QQ好友发信息

阅读数 1万+

python给QQ好友发信息博文来自: fallinlovelj的技术专栏

图片像素对比OpenCV实现,实现人工分割跟算法分割图像结果的对比

阅读数 3620

// imageMaskComparison.cpp : 定义控制台应用程序的入口点。 // #include "stdafx.h" #include #include #include u...博文来自: shiter编写程序的艺术

连续特征离散化和归一化

阅读数 1万+

连续特征进行离散化处理。博文来自: hero_fantao的专栏

关注
原创
24
粉丝
4
喜欢
0
评论
0
等级:
 
访问:
 
1195
积分:
 
247
排名:
 
36万+
勋章:
 
  •  
 
 
你的浏览器目前处于缩放状态,页面可能会出现错位现象,建议100%大小显示。
posted on 2019-03-12 17:41  ~handsome  阅读(300)  评论(0编辑  收藏  举报