06 2021 档案

摘要:1. 创建分桶分区表 set hive.enforce.bucketing=true; --设置自动分桶参数 CREATE Table `tmp_wfll_log_url` ( `log_time` string, `log_key` string, `url_detail` string, `ur 阅读全文
posted @ 2021-06-30 18:05 欣欣姐 阅读(1014) 评论(0) 推荐(0) 编辑
摘要:Hive和HBase的区别 Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hiv 阅读全文
posted @ 2021-06-29 13:57 欣欣姐 阅读(2138) 评论(0) 推荐(0) 编辑
摘要:一、hive架构相关 可以结合平时使用hive的经验作答,也可以结合下图从数据的读入、解析、元数据的管理,数据的存储等角度回答: 二、hive的特点 本题主要为了考察对hive的整体使用场景的掌握程度,毕竟只有知道了hive的特点,才能有针对性的在实际项目中的合适场景下使用hive。 可以从下面四个 阅读全文
posted @ 2021-06-29 11:40 欣欣姐 阅读(347) 评论(0) 推荐(0) 编辑
摘要:基础题目 1、Apache Kafka 是什么? Apach Kafka 是一款分布式流处理框架,用于实时构建流处理应用。它有一个核心 的功能广为人知,即作为企业级的消息引擎被广泛使用。 你一定要先明确它的流处理框架地位,这样能给面试官留 下一个很专业的印象。 2、什么是消费者组? 消费者组是 Ka 阅读全文
posted @ 2021-06-28 18:06 欣欣姐 阅读(257) 评论(0) 推荐(0) 编辑
摘要:需要将单元格合并居中 from openpyxl import load_workbook from openpyxl.styles import Font, colors, Alignmentimport osos.chdir(r'C:\Users\86159\Desktop\file')exce 阅读全文
posted @ 2021-06-22 10:14 欣欣姐 阅读(1284) 评论(0) 推荐(0) 编辑
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*-” #只对当前文件的中文编码有效 # Filename : Write_excel_Format.py import os import time import xlwt #检测当前目录下是否有TestData 阅读全文
posted @ 2021-06-21 18:29 欣欣姐 阅读(251) 评论(0) 推荐(0) 编辑
摘要:dict中将key相同的字典合并在一个对象里 lis=[('hadoop', 'hadoop1'), ('hadoop', 'hadoop2'), ('flume', 'flume1'), ('flume', 'flume2'), ('hadoop', 'hadoop3'), ('flink', ' 阅读全文
posted @ 2021-06-03 17:49 欣欣姐 阅读(1223) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示