【面试题】大数据开发岗位

Linux
1、使用 linux 命令从字符串 apple@163.com 中提取 apple

2、将 apple@163.com 替换为 apple@qq.com

3、配置crontab 定时调度,每小时10分执行 /data/checklog.sh 脚本

数据库
1、Oracle 数据库中,通过()访问能够以最快的方式访问表中的一行数据
A、主键 B、Rowid
C、唯一索引 D、整表扫描

2、Oracle数据库中,下面()可以作为有效的列名
A、Column B、123_NUM
C、NUM_#123 D、#NUM123

3、Oracle 数据库中,以下()命令可以删除整个表中的数据,并且不能够回滚
A、drop B、delete
C、truncate D、cascade

4、数据字典在SGA的哪一个组件中缓存()
A、数据库告诉缓冲区 B、共享池
C、PGA D、重做日志缓冲区

5、通过 sql 将 emp 的数据转化成emp_reqult
emp

id Dept Intype income
1 Sale Master 2000
1 Sale Slave 1000
2 Dev Master 3000
2 Dev Slave 2000

emp_result

id Dept Master Slave
1 Sale 2000 1000
1 Dev 3000 2000

6、删除 emptest 的重复数据

id Dept Intype income
1 Sale Master 2000
2 Sale Slave 1000
3 Sale Master 2000
4 Sale Slave 1000
5 Dev Master 2000
6 Dev Slave 1000
7 Dev Master 2000
8 Dev Slave 1000

7、规划一个简答的数据仓库架构图。

参考答案:

Linux :
1、
echo "apple@163.com" | grep -o apple

2、
echo "apple@163.com" | sed 's/163/qq/g'

3、
10 * * * *  sh /data/checklog.sh

数据库:

1、B
2、C
3、C
4、B 
5、
 select id, dept ,
 sum(case when Intype="Master" then income else 0 end ) as Master,
 sum(case when Intype="Slave" then income else 0 end ) as Slave
 from emp
 group by id,dept

6、

7、
posted @ 2020-09-03 22:11  水木青楓  阅读(774)  评论(0编辑  收藏  举报