摘要: Kafaka安装: 上传kafaka安装包: 解压安装包到指定目录: sudo tar -zxf kafka_2.11-0.10.2.0.tgz -C /opt/module/ 一定要赋予权限: sudo chown -R hadoop ./kafka 打开一个终端输入下面命令启动Zookeeper 阅读全文
posted @ 2022-03-15 20:49 风吹过半夏 阅读(520) 评论(0) 推荐(0) 编辑
摘要: kafka介绍: Kafka是一种高吞吐量的分布式发布订阅消息系统,用户通过Kafka系统可以发布大量的消息同时也能实时订阅消费消息 Kafka可以同时满足在线实时处理和批量离线处理 在公司的大数据生态系统中,可以把Kafka作为数据交换枢纽,不同类型的分布式系统(关系数据库、NoSQL数据库、流处 阅读全文
posted @ 2022-03-15 20:46 风吹过半夏 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 3、 数据可视化:利用JavaWeb+Echarts完成数据图表展示过程(20分) 需求1:可视化展示截图 需求2:可视化展示截图 需求3:可视化展示截图 需求4:可视化展示截图 4、 中文分词实现用户评价分析。(20分) (1)本节通过对商品评论表中的差评数据,进行分析,筛选用户差评点,以知己知彼 阅读全文
posted @ 2022-03-15 17:27 风吹过半夏 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 1、 数据采集(要求至少爬取三千条记录,时间跨度超过一星期):(10分) (1) 源程序代码: # -*- coding: utf-8 -*- import urllib.request import json import time import random def crawlProductCo 阅读全文
posted @ 2022-03-15 17:24 风吹过半夏 阅读(85) 评论(0) 推荐(0) 编辑