06 2021 档案
摘要:1. 创建分桶分区表 set hive.enforce.bucketing=true; --设置自动分桶参数 CREATE Table `tmp_wfll_log_url` ( `log_time` string, `log_key` string, `url_detail` string, `ur
阅读全文
摘要:Hive和HBase的区别 Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hiv
阅读全文
摘要:一、hive架构相关 可以结合平时使用hive的经验作答,也可以结合下图从数据的读入、解析、元数据的管理,数据的存储等角度回答: 二、hive的特点 本题主要为了考察对hive的整体使用场景的掌握程度,毕竟只有知道了hive的特点,才能有针对性的在实际项目中的合适场景下使用hive。 可以从下面四个
阅读全文
摘要:基础题目 1、Apache Kafka 是什么? Apach Kafka 是一款分布式流处理框架,用于实时构建流处理应用。它有一个核心 的功能广为人知,即作为企业级的消息引擎被广泛使用。 你一定要先明确它的流处理框架地位,这样能给面试官留 下一个很专业的印象。 2、什么是消费者组? 消费者组是 Ka
阅读全文
摘要:需要将单元格合并居中 from openpyxl import load_workbook from openpyxl.styles import Font, colors, Alignmentimport osos.chdir(r'C:\Users\86159\Desktop\file')exce
阅读全文
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*-” #只对当前文件的中文编码有效 # Filename : Write_excel_Format.py import os import time import xlwt #检测当前目录下是否有TestData
阅读全文
摘要:dict中将key相同的字典合并在一个对象里 lis=[('hadoop', 'hadoop1'), ('hadoop', 'hadoop2'), ('flume', 'flume1'), ('flume', 'flume2'), ('hadoop', 'hadoop3'), ('flink', '
阅读全文