第九节 面试专项
0 面试类型
一般为线上视频面试,国内疫情形式紧张。线下面试较少。线上面试有些技巧可言的。面试时间一般每个人就五分钟时间左右。
1 自我介绍
不要以为只有英文自我介绍,在正式面试的时候需要准备一下1-2分钟左右的自我介绍。自我介绍可以在本地开启一个文本文档,面试时照着念就行,避免紧张说不出话,或者说错话,说话没有逻辑性。可参考以下模板进行。
【备注:我不知道你们考研复试还有双机位等,自己准备好自我介绍,然后自己背诵下来,反正也就几百字!!!】
1.1 成绩优秀类型
老师们好,我叫小明,今年22岁,初试分数为:370分,本科专业是读的软件工程,一直以来对计算机都很感兴趣,大学期间所有关于专业课相关的比赛我都积极参加,也拿到过不少奖项,大学期间成绩还可以,专业排名一直都是前10%,先后获得**奖学金。因为对计算机人工智能等方面比较感兴趣,在大二至大三期间就加入了学院的创新实验室,参加了一个名为《机器学习体验平台》的项目,该项目主要提供一些常见的人工智能工具供老师和学生进行使用,目前工具已经集成了图像识别、文字识别、自然语言处理、语音识别、人脸识别等AI工具。通过这个项目,我对人工智能机器学习方面充满了兴趣,自学了机器学习的基础知识和线性回归和逻辑回归的算法,然后利用线性回归做了一个房价预测模型,完成了这个模型后,我欣喜若狂,这也坚定了我考研的决心,想在研究生阶段深入学习这方面知识,希望老师们能给我这个机会,我将感激不尽。
老师们好,我叫小李,初试分数为:370分,本科专业是读的计算机科学与技术,大学期间成绩优异,获得了奖学金,除此之外,我还积极参与学科类竞赛,在比赛中获得奖,并且拿到了四六级证书,软件设计师证书等。在校期间和同学一起完成了一个文字识别小程序项目,该项目是拍照将图片中的文字提取出来,主要是利用百度飞桨的AI能力实现。通过这个项目,我对人工智能机器学习方面充满了兴趣,自学了机器学习的基础知识和线性回归和逻辑回归的算法,然后利用线性回归做了一个预测模型,其中在预测的结果模型评估中,MSE值降低至:1021.457,R2值为0.918。本科期间在人工智能方面接触较少,希望再研究生期间深入研究学习这方面知识。谢谢老师的倾听。
1.2 学习一般且啥也没有类型
老师们好,我叫小王,初试分数为:370分,本科专业是读的计算机科学与技术专业,兴趣爱好比较广泛,喜欢户外运动、爬山、旅游等,在本科期间也很喜欢学习新的技术,大学期间除了学校教的C++、Java,我还自学了Python语言以及Java的Spring Boot等框架,并使用Java做了一个人工智能平台,***,使用Python语言和线性回归做了一个项目。
1.3 跨专业考研类型
老师们好,我叫小张,初试分数为:370分,本科专业是土木工程专业,本科期间成绩优异,获得奖学金,并拿到证书。(开始解锁为什么要考计算机) 除了对本专业感兴趣之外,我对计算机专业也非常感兴趣,大学期间加入了学校的计算机协会,在计算机协会里面做了一个**项目,该项目主要功能是(一两句话描述项目,让老师知道你做了啥。)业余时间自学了计算机相关知识,也结实了很多计算机的朋友,我对计算机的热爱,丝毫不亚于计算机专业的同学,于是我想考取计算机的研究生,深入学习计算机知识。谢谢老师
1.3 跨专业考研避雷。
虽然你们的目的都是因为计算机好就业薪资高,但是在复试中不要提到这些东西,因为研究生是属于研究性质的,学术性质的,很忌讳出现如此功利性的目的。所以尽可能的避开这些词汇的出现。
2 面试应该如何准备
2.1 基础知识篇
基础知识一般会问一写《计算机网络》、《操作系统》、《计算机组成原理》、《数据库原理》专业课知识。
2.1.1 计算机网络
1、TCP,UDP介绍,差别
�TCP是面向连接的可靠传输 UDP是无连接的不可靠传输
TCP是头部消耗大最少20字节 UDP8字节
TCP是面向字节流的 UDP是面向报文的
TCP是只支持1对1通信 UDP可以1对多 多对一 多对多通信
�2、简述TCP的三次握手四次挥手
三次握手:客户端发出一个报文头部SYN标志位为1,并发送一个sqn为x,此时客户端进入SYN—SEND状态,服务端收到连接请求回应一个报文,
其中标志位ACK确认号为1,SYN标志位为1,seq为y,ack为x+1,此时客户端进入SYN—received状态。客户端收到报文后,发送ACK确认号为1,
ack为y+1,seq为x+1。
四次握手: 客户端发出一个报文,其中标志位FIN为1,seq为x,客户端进入final-wait状态。服务端收到后发送ACK=1 ack=x+1 seq=y,
此时服务端进入Close-wait状态,此时服务端任然可以继续发送数据,等服务端发送完后发送一个FIN=1,ACK=1,seq=z,ack=x+1,
此时服务端进入Last-ACK状态。客户端收到后发送确认ACK=1,seq=x+1,ack=z+1。服务端收到后进入连接关闭状态,此时客户端进入
Time—wait状态,等待2个MSL时间后,连接关闭。
3、TCP/IP协议的可靠性是怎样保证的?(滑动窗口)
主要是停止等待协议和连续ARQ协议。
停止等待协议是最简单的可靠传输,因为它发送一个包就等待对方确认,收到确认后就发送下一个包,若超时就重发。
停止等待协议效率太低了,所以就基于流水线的原理有了连续ARQ协议,连续ARQ协议是维持了一个滑动窗口,位于发送窗口内的分组都可连续发送出去,
而不需要等待对方的确认,发送方每收到一个确认, 就把发送窗口向前滑动一个分组的位置。TCP每发送一个报文段,就对这个报文段设置一次计时器,
只要计时器设置的重传时间到但还没有收到确认,就要重传这一报文段。
4、IP地址有哪几类
A类,B类,C类,D类,E类。
A类、B类、和C类这三类地址用于TCP/IP节点,其它两类D类和E类被用于特殊用途。
�
�5、TCP、OSI网络模型有几层
TCP四层(网络接口层、网络层、传输层、应用层)
OSI七层(物理层、数据链路层、网络层、传输层、会话层、表示层、应用层)
五层模型(物理层、数据链路层、网络层、传输层、应用层)
其他的有时间就自己多去准备。
2.1.2 操作系统
时间关系,你们自己去百度答案。
1、进程和线程
2、进程的状态
3、进程的调度策略
4、死锁、死锁条件、死锁避免
5、物理地址、逻辑地址、相对地址、绝对地址
这方面一般问的不多。
2.1.3 计算机组成原理
冯诺依曼体系结构的计算机分为哪几层?
这个一般问的比较少,网上找一下别人问过的问题,简单准备一下就行。
2.1.4 数据库原理
这个问的也比较少,记得一二三BC范式这些,其他好像问的也不多,网上找找吧。
2.2 项目篇
2.2.1 百度AI平台搭建的人工智能平台
昨天模拟面试了三个同学,发现大家的项目虽然名字不一样,但是功能描述都很相似,我觉得这样子不妥,所以给了几个参考供大家选择。
1、文字提取器
这个主要是在学习过程中、期末考试复习中会有很多资料是以图片形式,或者是图书馆的书籍上的文字,想把这些资料以文字形式保存在电脑中,若人工去打字需要消耗大量的时间,所以利用百度PaddlePaddle的AI能力进行文字识别,做了一个文字提取器。
2、图书管理系统
在做图书管理系统课设的时候,发现同学借书输入书本的ISBN编码非常的费时且不方便,于是利用百度AI的能力,在图书系统中加了一个文字识别功能,只需要将书本放入摄像头下,就能自动识别书本名称,作者,版本,然后拱管理员选择对应的书本,大大节省图书借阅时间。
3、语音识别系统
在上课的时候,将老师讲的关键知识点录音记录下来,但是语言转文字基本上都是收费的,免费额度基本上都是一分钟左右,所以利用百度飞桨AI平台做了一个语言转文字的小工具。
4....
项目细节:
1、你有没有了解过文字识别背后的过程是什么?
(以下是详细流程,整理成自己的话,几句话描述清楚整个流程)
OCR识别提取图片中文字原理
· 预处理:对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息,以便方便后面的处理。在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了。降噪在这个阶段非常重要,降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。
· 特征提取和降维:特征是用来识别文字的关键信息,每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说,这个特征提取是比较容易的,因为数字只有10个,英文字母只有52个,都是小字符集。对于汉字来说,特征提取比较困难,因为首先汉字是大字符集,国标中光是最常用的第一级汉字就有3755个;第二个汉字结构复杂,形近字多。在确定了使用何种特征后,视情况而定,还有可能要进行特征降维,这种情况就是如果特征的维数太高(特征一般用一个向量表示,维数即该向量的分量数),分类器的效率会受到很大的影响,为了提高识别速率,往往就要进行降维,这个过程也很重要,既要降低维数吧,又得使得减少维数后的特征向量还保留了足够的信息量(以区分不同的文字)。
· 分类器设计、训练和实际识别:分类器是用来进行识别的,就是对于第二步,对一个文字图像,提取出特征给,丢给分类器,分类器就对其进行分类,告诉你这个特征该识别成哪个文字。
· 后处理:后处理是用来对分类结果进行优化的,第一个,分类器的分类有时候不一定是完全正确的(实际上也做不到完全正确),比如对汉字的识别,由于汉字中形近字的存在,很容易将一个字识别成其形近字。后处理中可以去解决这个问题,比如通过语言模型来进行校正——如果分类器将“在哪里”识别成“存哪里”,通过语言模型会发现“存哪里”是错误的,然后进行校正。第二个,OCR的识别图像往往是有大量文字的,而且这些文字存在排版、字体大小等复杂情况,后处理中可以尝试去对识别结果进行格式化,比如按照图像中的排版排列什么的,举个栗子,一张图像,其左半部分的文字和右半部分的文字毫无关系,而在字符切分过程中,往往是按行切分的,那么识别结果中左半部分的第一行后面会跟着右半部分的第一行诸如此类。
项目提问:
2、分类器是怎么设计的,运用了什么算法。
遇到这种不会的话题,统一话术,往自己会的地方引入,看似答得朗朗上口,其实答非所问。
我了解到的分类算法一般是,逻辑回归、K-近邻算法、决策树、神经网络这些。因为是用的百度训练好的模型,不清楚百度用到的什么分类算法。
3、介绍一下你了解的决策树算法?
我会一些简单的机器学习算法,线性回归逻辑回归这些,因为当时要准备初试原因,所以没有深入的去学习后面的算法,我会抓紧时间在入学前掌握这些常见的机器学习算法的。
4、那介绍一下逻辑回归算法吧?
自己去总结,我之前文档写的很详细了。
5、说说你了解的人工智能。
人工智能包含机器学习和深度学习,其中机器学习又包含深度学习,学习的形式一般分为监督学习和无监督学习....
3、其他问题:
1 平时有哪些兴趣爱好?
说正能量的,说喜欢打游戏、看剧、看小说我™呼死你。说唱歌、看电影、运动、户外、旅行都可以。
2 平时喜欢看那些书?
说专业书比较好,比如说《大话数据结构》、最近在看李开复教授的《深度学习》,当然也可以说一些名著,哲学等其他学科的书籍,尽量不要说一些很随意的书。
3 关系类的,男女朋友有吗?
这个随意答,有就说我们二人共同进步,一起考研,切记不要一个工作一个读研。没有就说暂时没有遇到有缘人。
4 如何评价你自己?(你的优点是什么?你的缺点是什么?)
说说自己的优缺点