2014网易运营工程师笔试题(邮件运维)--题解--第二天
1.对于多关键字而言,那种文件组织方便而又高效()
A、顺序文件 B、倒排文件 C、散列文件 D、B+树索引文件
文件在外存上的基本的组织方式有四种:顺序组织,索引组织,散列组织和链组织;对应的的文件名称分别为:顺序文件、索引文件、散列文件和多关键字文件。选择哪一种文件组织方式,取决于对文件中记录的使用方式和频繁程度、存取要求、外存的性质和容量。
多关键字文件:包含有多个次关键字索引的文件称为多关键字文件。
倒排表的主要优点是:在处理复杂的多关键字查询时,可在倒排表中先完成查询的交、并等逻辑运算,得到结果后再对记录进行存取。这样不必对每个记录随机存取,把对记录的查询转换为地址集合的运算,从而提高查找速度。
Google用的就是倒排索引
2.以下哪些算法可用于遍历网络图()
A、广度优先搜索 B、深度优先搜索 C、线性规划策略 D、决策树
广度优先搜索假设从图中某个顶点v出发,在访问了v之后依次访问v的各个未曾访问过的邻接点,然后再分别从这些邻接点 出发依次访问它们的邻接点,并使先被访问的顶点的邻接点先于后被访问的顶点的邻接点被访问(因此需要用队列来存储顶点),直到图中所有已被访问的顶点的邻 接点都被访问为止。如果此时图中还有未被访问的顶点,则另选图中未被访问的顶点作为起点,重复上述过程,直到图中所有顶点都被访问为止。
深度优先搜索法是树的先根遍历的推广,它的基本思想是:从图G的某个顶点v0出发,访问v0,然后选择一个与v0相邻 且没被访问过的顶点vi访问,再从vi出发选择一个与vi相邻且未被访问的顶点vj进行访问,依次继续。如果当前被访问过的顶点的所有邻接顶点都已被访 问,则退回到已被访问的顶点序列中最后一个拥有未被访问的相邻顶点的顶点w,从w出发按同样的方法向前遍历,直到图中所有顶点都被访问。
3.我们使用一个6元组<a,b,c,d,e,f>来表示6个节点的无向图的顶点数,请问以下哪些6元组是可能的组合()
A、<1,2,3,4,5,6> B、<2,4,4,2,3,5> C、<1,3,4,2,2,1> D、<1,2,2,4,5,2>
画画吧!
4.以下关于可计算性的说法正确的是()
A、 所有问题最终都可以抽象为一个计算模型,图灵机可以在一个有限的时间(虽然可能会占用非常久的时间)内完成计算:现代计算机的设计正是基于该理论。
B、 存在部分问题,我们无法在有限时间内,给出解答:但是,所有问题都可以在有限时间内验证其解答的正确性。
C、 Godel(哥德尔)第一定律指明不存在完备且相容的公理系统。
D、 以上说法都不正确。
5.16进制数值C396和8进制数值64474的异或结果值(10进制)为()
A、43690 B、16660 C、60350 D、20375
计算器算一下,异或:相同取0,不通取1
6.以下经典的问题哪些属于NP问题()
A、图灵停机问题 B、排序 C、0,1背包问题 D、枚举有限集合的所有子集
7.存在以下字母串:AGDCCDDDGFBBFFGGDDDGGGEFFDDCCCDDDFGAAA现在需要对该串进行Huffman编码,那么字母F对应bit值(二进制格式为)()
A、10 B、11 C、110 D、101
解:总共:38字符,F为6个字符。
其中A:4,B:2,C:5,D:12,E:1,F:6,G:8
按着规则走起!
霍夫曼编码:(Huffman Coding)是一种编码方式,是一种用于无损数据压缩的熵编码(权编码)算法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码。
HC 具体方法: 先按出现的概率大小排队,把两个最小的概率相加,作为新的概率 和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变成1。每次相 加时都将“0”和“1”赋与相加的两个概率,读出时由该符号开始一直走到最后的“1”, 将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。
8.进程管理如果设计不当将会导致“死锁”的产生,对待死锁,典型的银行家算法属于(1),而剥夺资源属于(2)的方法
A、(1)=死锁预防,(2)=死锁避免
B、(1)=死锁预防,(2)=死锁解除
C、(1)=死锁避免,(2)=死锁预防
D、(1)=死锁避免,(2)=死锁解除
死锁: 是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。
系统产生死锁的四个必要条件:
(1)互斥条件:指进程对所分配到的资源进行排它性使用,即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源,则请求者只能等待,直至占有资源的进程用毕释放。
(2)请求和保持条件:指进程已经保持至少一个资源,但又提出了新的资源请求,而该资源已被其它进程占有,此时请求进程阻塞,但又对自己已获得的其它资源保持不放。
(3)不剥夺条件:指进程已获得的资源,在未使用完之前,不能被剥夺,只能在使用完时由自己释放。
(4)环路等待条件:指在发生死锁时,必然存在一个进程——资源的环形链,即进程集合{P0,P1,P2,···,Pn}中的P0正在等待一个P1占用的资源;P1正在等待P2占用的资源,……,Pn正在等待已被P0占用的资源。
银行家算法: 我们可以把操作系统看作是银行家,操作系统管理的资源相当于银行家管理的资金,进程向操作系统请求分配资源相当于用户向银行家贷款。操作系统按照银行家制 定的规则为进程分配资源,当进程首次申请资源时,要测试该进程对资源的最大需求量,如果系统现存的资源可以满足它的最大需求量则按当前的申请量分配资源, 否则就推迟分配。当进程在执行中继续申请资源时,先测试该进程已占用的资源数与本次申请的资源数之和是否超过了该进程对资源的最大需求量。若超过则拒绝分 配资源,若没有超过则再测试系统现存的资源能否满足该进程尚需的最大资源量,若能满足则按当前的申请量分配资源,否则也要推迟分配。
9.关于数据库索引,以下说法正确的是()
A、针对某些字段建立索引,能够有小减少相关数据库表的磁盘空间占用;
B、针对某些字段建立索引,能够有效的提升相关字段的读与写的效率;
C、常见数据库管理系统,通常使用hash表来存储索引;(索引的实现通常使用B树及其变种B+树)
D、数据库索引的存在,可能导致相关字段删除的效率降低;