pinoky - 博客园

2024年12月18日

摘要： 2024.12.18 update，百度推荐中台三面后六天挂了秋招到现在，中大厂当中，腾讯终面挂，字节两轮排序挂，虾皮排序挂，百度终面挂……终面挂真的太搞心态了，我是什么很贱的人吗orz 在腾讯实习时的mentor评价说，技术绝对没有问题，可能只是欠缺点缘分，希望下一个流程里好运能降临吧排序详解阅读全文

posted @ 2024-12-18 21:03 pinoky 阅读(84) 评论(0) 推荐(0)

2024年12月11日

推荐系统（一）

摘要： 2024.12.9号面试了百度用户增长部门中台一面，了解到部门主要做一些推送工作，涉及到推荐系统的召回和排序等工作，故了解学习了推荐系统的大致知识，待后续更新 ps：明天三面，希望能过，想要一个大厂offer结束折磨的秋招了TAT 推荐系统的链路召回：快速从海量数据取回几千个用户可能感兴趣的物品，阅读全文

posted @ 2024-12-11 20:25 pinoky 阅读(67) 评论(0) 推荐(0)

2024年9月27日

Spark学习（二）：RDD详解

摘要： Spark学习（二）：RDD详解 RDD API 一般来说有三种创建RDD的方式由外部存储系统的数据集创建（比如本地的文件系统，同时兼容所有Hadoop支持的数据集）：sc.textFile 通过已有的RDD通过算子转换生成新的RDD：rdd1.flatMap(_.split(" ")) 通过一个阅读全文

posted @ 2024-09-27 11:16 pinoky 阅读(384) 评论(0) 推荐(0)

2024年9月23日

Spark学习（一）：概述

摘要： 2024.9.14腾讯广告一面时，被问到是否了解Spark，彼时对Spark毫无接触故答不了解，面试结束后了解到Spark与MapReduce渊源颇深，去年夏天学习MIT6.824分布式系统设计时曾深入学习过MapReduce（分布式学习：MapReduce - pinoky - 博客园 (cnbl 阅读全文

posted @ 2024-09-23 21:23 pinoky 阅读(136) 评论(0) 推荐(0)

2024年9月16日

网络IO与IO模型

摘要：网络IO 典型的一次IO两个阶段是：数据准备和数据读写在数据准备阶段，根据系统IO操作的准备状态，分为两种阻塞：比如int size = recv(sockfd, buf, 1024, 0);如果sockfd没有数据的话，当前线程会阻塞在此处，数据可读时唤醒非阻塞：比如以上的语句把sockfd 阅读全文

posted @ 2024-09-16 21:34 pinoky 阅读(63) 评论(0) 推荐(0)

IO多路复用源码分析

摘要： IO多路复用源码分析 select源码分析 select函数可以同时监听多个文件描述符，当某个文件描述符就绪时，select函数返回，程序可以通过遍历文件描述符集合来确定哪些文件描述符已经就绪，随后可进行相应的操作 fd_set rfds; FD_ZERO(&rfds_storage); //清空位阅读全文

posted @ 2024-09-16 21:30 pinoky 阅读(56) 评论(0) 推荐(0)

2024年9月15日

分布式学习：Raft算法以及具体实现

摘要： Raft算法一致性算法的要求：安全性，网络延迟、分区、丢包、重复和乱序等错误需要保证正确可用性：集群中只需要大多数机器即可运行不依赖时序保证一致性三种状态：follower，candidate，leader 任期：逻辑时钟的作用，每一段任期从一次选举开始分票可能会导致一个任期没有lead 阅读全文

posted @ 2024-09-15 10:44 pinoky 阅读(81) 评论(0) 推荐(0)

分布式学习：MapReduce

摘要： MapReduce的设计 MapReduce 是一种用于处理大规模数据集的编程模型和处理框架，它执行的三个阶段： map阶段：master将输入数据分成M个独立数据块，并将每一个数据块交给一个map-worker来执行map任务（将输入数据转换为键值对的形式，然后对每个键值对执行某种操作，生成中间结阅读全文

posted @ 2024-09-15 10:43 pinoky 阅读(41) 评论(0) 推荐(0)

2024年9月14日

数据类型与底层原理

摘要：数据类型与底层原理数据结构哈希表 redis使用链式哈希来解决哈希冲突，其Hash表实质上是一个二维数组，其中每一项就是一个指向哈希项（dictEntry）的指针 typedef struct dictht { dictEntry **table; //二维数组 unsigned long si 阅读全文

posted @ 2024-09-14 23:35 pinoky 阅读(35) 评论(0) 推荐(0)

主从库与切片集群机制

摘要：主从库与切片集群机制主从复制源码剖析 redis的主从复制主要包括全量复制RDB文件，增量复制，长连接同步，使用了基于状态机的设计思想，来实现不同状态和状态间的跳转基于状态机实现的话，在开发程序时只需要考虑不同状态下具体要执行的操作，以及状态之间的跳转条件即可四大阶段初始化阶段：将实例A设置阅读全文

posted @ 2024-09-14 23:35 pinoky 阅读(44) 评论(0) 推荐(0)