百里登风

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

06 2020 档案

3.kafka学习
摘要:kafka是什么Kafka最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的,发布/订阅模式的消息队列(Message Queue),Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。经过多年发展,Kafka已经由最初的日志 阅读全文

posted @ 2020-06-25 01:14 百里登峰 阅读(222) 评论(0) 推荐(0) 编辑

2.HBase相关学习
摘要:1.HBase shell操作 hbase shell 查看版本 version 查看服务状态 status 查看有哪些表 list 创建表 create 'students','info' list 查看表结构 describe 'students' 插入数据 put 'students','10 阅读全文

posted @ 2020-06-13 16:20 百里登峰 阅读(217) 评论(0) 推荐(0) 编辑

airflow HiveOperator实例
摘要:此实例的测试环境是airflow部署在服务器而不是部署在容器 hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表, 并提供简单的 sql 查询功能,可以将 sql 语句转换为 MapReduce 任 务进行运行。在 airflow 中调用 hive 任务,首 阅读全文

posted @ 2020-06-02 14:53 百里登峰 阅读(2242) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示