摘要: 环境配置 1.在pycharm中下载Selenium 2.谷歌浏览器驱动程序下载地址: http://chromedriver.storage.googleapis.com/index.html 简单小例子 import time from selenium import webdriver # 设 阅读全文
posted @ 2022-07-16 17:17 是帅哥没错 阅读(30) 评论(0) 推荐(0) 编辑
摘要: flume启动停止脚本 1.在bin/目录下创建f1.sh vim f1.sh 写入 #! /bin/bash case $1 in "start") for i in hadoop01 hadoop02 do echo" 启动 $i 采集flume " ssh $i "nohup /opt/flu 阅读全文
posted @ 2022-05-16 19:21 是帅哥没错 阅读(240) 评论(0) 推荐(0) 编辑
摘要: flume+kafka配置 1.在flume/conf目录下创建flume-kafka.conf文件 2.写入如下配置 #为各组件命名 a1.sources = r1 a1.channels = c1 #描述source a1.sources.r1.type = TAILDIR a1.sources 阅读全文
posted @ 2022-05-16 18:40 是帅哥没错 阅读(437) 评论(0) 推荐(0) 编辑
摘要: 自定义flume拦截器 使用IDEA自定义flume拦截器 1.创建maven工程flume-interceptor 2.创建包com.flume.interceptor 3.在pom.xml中添加如下配置 <dependencies> <dependency> <groupId>org.apach 阅读全文
posted @ 2022-05-16 18:32 是帅哥没错 阅读(205) 评论(0) 推荐(0) 编辑
摘要: Python爬虫之爬取豆瓣top import bs4 # 网页解析,获取数据 import re # 正则表达式,进行文字匹配 import urllib.request # 制定URL,获取网页数据 import urllib.parse import xlwt # 进行Excel操作 impo 阅读全文
posted @ 2022-05-16 17:06 是帅哥没错 阅读(76) 评论(0) 推荐(0) 编辑
摘要: kafka较新版本的常用命令 kafka2.2之后版本中使用--zookeeper hadoop01:2181会出现报错情况,2.2之后的版本使用了--bootstrap-server hadoop01:9092来替换--zookeeper hadoop01:2181 下面给出较新版本常用命令: # 阅读全文
posted @ 2022-05-12 14:19 是帅哥没错 阅读(183) 评论(0) 推荐(0) 编辑
摘要: kafka闪退之Cluster ID不匹配的问(已解决) 1.打开kafka目录下的logs/server.log,看到以下错误 2.修改log.dirs路径下的meta.properties文件,将luster.id的值改成和报错信息中的值一样即可 阅读全文
posted @ 2022-05-12 13:43 是帅哥没错 阅读(984) 评论(0) 推荐(0) 编辑
摘要: kafka集群安装 前提:安装成功zookeeper 1.下载 到apache官网下载对应的kafka 2.解压 # tar -zxvf kafka_2.12-3.1.0.tgz -C /opt 3.修改配置文件 进入conf/目录修改server.properties中的部分配置 # The id 阅读全文
posted @ 2022-05-11 22:32 是帅哥没错 阅读(84) 评论(0) 推荐(0) 编辑
摘要: zookeeper集群启动脚本 在Hadoop01的bin/目录下创建zookeeper启动脚本zk.sh vim zk.sh 插入以下内容 #!/bin/bash case $1 in "start"){ for i in hadoop01 hadoop02 hadoop03 do echo zo 阅读全文
posted @ 2022-05-11 21:55 是帅哥没错 阅读(167) 评论(0) 推荐(0) 编辑
摘要: zookeeper集群搭建 版本: VMware Workstation Pro16.2 hadoop2.7 centos7 1.下载 到apache官网下载对应的zookeeper 2.解压 # tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /opt 阅读全文
posted @ 2022-05-11 20:59 是帅哥没错 阅读(42) 评论(0) 推荐(0) 编辑