作者:lsyhahaha
出处:https://home.cnblogs.com/u/lsyhahaha/
部分文章和图片来自网络,如有侵权,联系删除,另外,有部分是本菜鸡学习过程中的记录,可能会有一些错误,如有疑问,希望在评论区提醒,3q

4月4日刷面经

每天刷三篇面经

1 2 3 4 5

五大数据开发岗,实际工作中有什么区别?

Hadoop

  1. 简单介绍一下Hadoop
  2. shuffle过程
  3. 数据倾斜问题处理方法
  4. 6.HDFS的读数据流程(深究) DataNode之间传输Packet一个过程 balabala
  5. HDFS支不支持多个客户端写同一个数据文件

C++

  1. 面向对象的特性?说一下三大特性的具体含义?

Python

  1. 你用python比较多的话,Python的垃圾回收是怎么做的。

JAVA

  1. java的回收机制,内存模型
  2. java8中lambda表达式
  3. 面向对象的特性?说一下三大特性的具体含义?

Spark

  1. spark和hadoop的区别
  2. spark怎么实现shffle的。答了基于hash的方式
  3. spark比较早的版本是基于hash实现shuffle的,新的版本是怎么实现shuffle的。

Mysql

  1. mysql存储过程

    存储过程是一个数据库对象,可以封装SQL语句集,可以用于比较复杂的业务,然后说说为什么用存储过程,如何使用存储过程,检查存储过程

  2. Mysql窗口函数

学习链接

窗口函数是mysql8.0的新特性,也称分析函数,类似与分组函数,但是不同的是,每一行都会生成一个结果.

image-20220404165503871

专用窗口函数

  1. 了解哪一种数据库,我说mysql

  2. 说一下mysql,我说了索引的相关知识,索引的类型,索引的优化,索引失效场景

    学习链接

    一种帮助mysql提高查询效率的数据结构

  3. 非关系型和关系型数据库的区别

    学习链接

  4. 问MySQL为什么采用B+树佐索引

    学习链接

Kafka

  1. Kafka的partition存储具体细节
  2. Kafka中索引和真实数据的具体查询机制(.index和.log,二分查找
  3. Kafka消费者组中如果一个消费者挂掉,会发生什么?(怎么保证后续消费的正常?) 补:涉及协议

Hive

算法题

  1. 算法题数组中的第 k 大的数字
  2. 给定一个 排序 的数组 arr ,两个整数 k 和 x ,从数组中找到最靠近 x (两数之差最小)的 k 个数。返回的结果必须要是按升序排好的。
  3. 阿里3.14笔试
    算法1,输入:16进制字符串,返回2进制中1的个数,思路,针对0~f,直接map,然后便利累加
    算法2,输入:给一个只包含0、1的二维数组,设置result,如果数组元素为0,上下左右四个方向只要有1存在,则result加1. 思路,三维dp,然后上下左右做四次循环,更新dp。最后累加

数据结构

  1. 写一个归并排序
  2. 排序的具体流程、时间复杂度、为什么是O(nlogn)

数据建模

  1. 问大数据建模了解不
posted @ 2022-04-04 16:35  lsyhahaha  阅读(15)  评论(0)    收藏  举报