百度2014校园招聘笔试题(成都站,软件研发岗)——2014.09.21

一、简答题(本题共30分)

1. 当前计算机系统一般会采用层次结构来存储数据,请介绍下典型的计算机存储系统一般分为哪几个层次,为什么采用分层存储数据能有效提高程序的执行效率?(10分)

 

2. Unix/Linux系统中僵尸进程是如何产生的?有什么危害?如何避免?(10分)

 

3. 简述Unix/Linux系统中使用socket库编写服务器端程序的流程,请分别用对应的socket通信函数表示(10分)

 

 

二、算法与程序设计题(本题共45分)

1. 使用C/C++编写函数,实现字符串反转,要求不使用任何系统函数,且时间复杂度最小,函数原型:char* reverse_str(char* str)。(15分)

 

2. 给定一个如下格式的字符串,(1,(2,3),(4,(5,6),7))括号内的元素可以是数字,也可以是另一个括号,请实现一个算法消除嵌套的括号,比如把上面的表达式变成:(1,2,3,4,5,6,7),如果表达式有误请报错。(15分)

 

3. (见下图)

 

 

三、系统设计题(本题共25分)

在企业中,对生产数据进行分析具有很重要的意义,但是生产数据通常不能直接用于数据分析,通常需要进行抽取、转换和加载,也就是通常说的ETL。

为了便于开发和维护,并提高数据实时性,通常将一个完整的ETL过程分为多个任务,组成流水线,如下图所示:

假设任务定义和任务之间的依赖关系都保存在文件中,文件格式分别如下:

 

问题:

1.  下面是ETL调度系统的模块图,请描述各个模块呃主要职责,以及各个线条的 含义。(10分)

 

2.  添加依赖关系时要避免出现环,假设系统同一个时刻只允许一个人添加任务依赖,请实现一个函数来检查新的依赖是否导致环,依赖的上游存在环会导致非正常的调度,因此也希望能避免。(10分)

a)  函数名:checkCycle

b)  输入:pairs,已存在的依赖关系((pre,post)……), newPair新的依赖关系(pre,post)

c)  输出:True: 不存在环,False: 存在环

 

3. 如果调度时,某个任务在其依赖的任务之前执行,必然导致错误,请实现调度算法,确保任务按照依赖顺序执行?(10分)

a)  函数名:schedule

b)  输入1:tasks,整数数组;

c)  输入2:task-relation,二元组数组,每个二元组表示一组关系;

d)  输出:task id序列,并行执行的用","分隔,其他的用";"分隔;

 

4. 给定一个任务,如何计算出他的最晚完成时间?(10分)

a)  函数名:calMaxEndTime

b)  输入1:tasks,3元组数组,(task_id, start_time, max_run_time);

c)  输入2:task-relations,二元组数组,每个二元组表示一组关系;

d)  输入3:task-id

e)  输出:最晚完成时间;

posted @ 2013-09-24 10:57  沉默的猿  阅读(1005)  评论(5编辑  收藏  举报
AmazingCounters.com
给我写信