摘要: Flume企业面试题 一,如何实现Flume数据传输的监控 使用第三方框架Ganglia实时监控Flume 二,Flume的Source,Sink,Channel的作用? 1.Source组件是专门用来收集数据的,可以处理各种类型,各种格式的日志数据,包括avro(为 Hadoop 提供数据序列号和 阅读全文
posted @ 2022-11-23 16:06 不落微笑 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 自定义source Source 是负责接收数据到 Flume Agent 的组件。Source 组件可以处理各种类型、各种格式的日志数据,包括 avro、thrift、exec、jms、spooling directory、netcat、sequence ,generator、syslog、htt 阅读全文
posted @ 2022-11-23 16:02 不落微笑 阅读(100) 评论(0) 推荐(0) 编辑
摘要: Flume基础 netcat(linux系统轻量级通信工具)安装 #桌面端可能自带 环境centos7 sudo yum install -y nc #开启服务端(端口9999) nc -lk 9999 #另一个窗口客户端监听 9999 nc localhost 9999 fluem官方案例测试 # 阅读全文
posted @ 2022-11-22 21:34 不落微笑 阅读(454) 评论(0) 推荐(0) 编辑
摘要: DROP TABLE, TRUNCATE TABLE, DELETE TABLE 三种删除语句的区别 1.DROP TABLE 清除数据并且销毁表,是一种数据库定义语言(DDL Data Definition Language), 执行后不能撤销,被删除表格的(schema)关系,索引,权限等等都会 阅读全文
posted @ 2022-11-16 20:50 不落微笑 阅读(166) 评论(0) 推荐(0) 编辑
摘要: Cassandra基础配置 一,集群部署 # conf/cassandra.yaml #集群名称配置,默认Test Cluster cluster_name: 'Test Cluster' #种子节点配置,若为单节点也可配置为127.0.0.1 #下方示例为三节点都作为种子节点 seed_provi 阅读全文
posted @ 2022-11-15 21:34 不落微笑 阅读(210) 评论(0) 推荐(0) 编辑
摘要: pandas中groupby()的参数as_index import pandas as pd df = pd.DataFrame(data={'books':['b1','b1','b1','b2','b2','b3'], 'price': [12,12,12,15,15,17],'num':[2 阅读全文
posted @ 2022-10-19 20:56 不落微笑 阅读(334) 评论(0) 推荐(0) 编辑
摘要: Matplotlib图形详解 一,全局的设置 import matplotlib as mpl #设置中文字体的显示问题 mpl.rcParams['font.family'] = 'SimHei' #文本在图上的任意位置显示 plt.text(13,35.2,'基础体温',bbox={'facec 阅读全文
posted @ 2022-10-16 10:31 不落微笑 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 关于远程连接不能用ip地址访问 在Linux使用jupyter-notebook --ip='*'来指定ip地址 阅读全文
posted @ 2022-10-16 10:20 不落微笑 阅读(20) 评论(0) 推荐(0) 编辑
摘要: Permission denied: user=test1, access=WRITE, inode="/d":hadoop:supergroup:dr core-site.xml文件的静态ip用户定义错误 阅读全文
posted @ 2022-10-16 10:20 不落微笑 阅读(13) 评论(0) 推荐(0) 编辑
摘要: CSS入门 一,初识 内部引用和外部引用 <head> <meta charset="UTF-8"> <title>标题</title> <!-- 规范,<style> 可以编写css代码 每一个语句最好以分号结尾 语法: 选择器{ 声明1; 声明2; 声明3; } --> <!-- <style> 阅读全文
posted @ 2022-10-15 15:31 不落微笑 阅读(31) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示