哥们要飞 - 博客园

2021年12月17日

【每日一题】2021年12月17日-72. 编辑距离

摘要：给你两个单词 word1 和 word2，请你计算出将 word1 转换成 word2 所使用的最少操作数。你可以对一个单词进行如下三种操作：插入一个字符删除一个字符替换一个字符来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/edit-d 阅读全文

posted @ 2021-12-17 19:52 哥们要飞阅读(24) 评论(0) 推荐(0) 编辑

2021年12月16日

【大数据面试】【数仓项目】其他知识点：行为数仓、业务数仓、拉链表、即席查询

摘要：一、用户行为数仓. 1、数仓分层架构图 2、埋点行为数据基本格式(基本字段) "ap":"xxxxx",//项目数据来源 app pc "cm": { //公共字段 "mid": "", // (String) 设备唯一标识 "uid": "", // (String) 用户标识 "vc": "1" 阅读全文

posted @ 2021-12-16 21:34 哥们要飞阅读(430) 评论(0) 推荐(0) 编辑

【大数据面试】【数仓项目】分层：ODS层、DWD层、DWS层、ADS层构成、操作

摘要：一、ODS层 1、保持数据原貌，不做任何修改 2、数据压缩：LZO压缩，减少磁盘空间 3、创建的是分区表：可以防止后续的全表扫描包括用户行为：string line dt ods_start； ods_event（商品列表、商品详情、点击广告点赞、评论、收藏 …… ）业务数据：8张表（用户阅读全文

posted @ 2021-12-16 17:17 哥们要飞阅读(1556) 评论(0) 推荐(0) 编辑

【每日一题】2021年12月16日-2. 两数相加

摘要：给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的，并且每个节点只能存储一位数字。请你将两个数相加，并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外，这两个数都不会以 0 开头。来源：力扣（LeetCode）链接：https://leetco 阅读全文

posted @ 2021-12-16 15:22 哥们要飞阅读(29) 评论(0) 推荐(0) 编辑

2021年12月15日

【大数据面试】【项目】数仓架构：离线、实时、数仓输入输出、选型、版本、服务器、集群规模、数据保存、组件安装分配

摘要：一、质疑分层不合理云上大数据数仓解决方案：https://www.aliyun.com/solution/datavexpo/datawarehouse 1、离线数仓--基于hive 2、实时数仓--基于kafka中间件每一步都会缓存至datahub 二、数仓概念 1、数仓的数据源和输出系统分别阅读全文

posted @ 2021-12-15 22:20 哥们要飞阅读(449) 评论(0) 推荐(0) 编辑

【大数据面试】sqoop：空值、数据一致性、列式存储导出、数据量、数据倾斜

摘要：一、有没有遇到过问题，怎么进行解决的 1、空值问题本质：hive底层存储空数据使用\n《==》MySQL存储空数据使用null 解决：双向导入均分别使用两个参数☆，之前讲过 2、数据一致性问题 Hive ==》 MySQL 默认是4个map 2个成功，2个失败原则：数据可以没有，但不能有错误原阅读全文

posted @ 2021-12-15 16:20 哥们要飞阅读(691) 评论(0) 推荐(0) 编辑

【每日一题】【集合非空判断】【逻辑运算符】2021年12月15日-144. 二叉树的前序遍历

摘要： /** * Definition for a binary tree node. * public class TreeNode { * int val; * TreeNode left; * TreeNode right; * TreeNode() {} * TreeNode(int val) { 阅读全文

posted @ 2021-12-15 15:31 哥们要飞阅读(19) 评论(0) 推荐(0) 编辑

【每日一题】2021年12月14日-82. 删除排序链表中的重复元素 II

摘要：存在一个按升序排列的链表，给你这个链表的头节点 head ，请你删除链表中所有存在数字重复情况的节点，只保留原始链表中没有重复出现的数字。返回同样按升序排列的结果链表。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/remove-dupl 阅读全文

posted @ 2021-12-15 08:59 哥们要飞阅读(27) 评论(0) 推荐(0) 编辑

2021年12月14日

【大数据面试】【框架】Hive：架构、计算引擎、比较、内外部表、by、函数、优化、数据倾斜、动静态分区

摘要：一、组成 1、架构源数据原本是存在dubby数据库，存在MySQL可以支持多个客户端客户端、数据存储（HDFS）、MR计算引擎 2、计算引擎的选择 MR引擎：基于磁盘，计算时间长，但一定能算出结果【一般用于计算周指标、月指标、年指标，一个任务3-5天】 tez引擎：基于内存，计算时间快，如果宕机阅读全文

posted @ 2021-12-14 22:27 哥们要飞阅读(249) 评论(0) 推荐(0) 编辑

2021年12月13日

【大数据面试】回顾

摘要：一、Linux 常用的5个高级命令：查看端口号netstat、查看进程ps、查看磁盘使用情况iotop 二、shell 1、shell的工具：awk、sed、sort、cut 2、写过哪些脚本？群起脚本、数仓与MySQL的数据导入导出、数仓不同层级之间的导入三、Hadoop 1、入门（1）常见阅读全文

posted @ 2021-12-13 17:45 哥们要飞阅读(37) 评论(0) 推荐(0) 编辑

哥们要飞的blog

Nice to meet you!

公告