大数据初级sy
1.spark 是用以下哪种编程语言实现的?
A.C B C++ C JAVA D.Scala (正确答案)
2.FusionInsight Manager 对服务的管理操作,下列说法错误的是?
A.可对服务进行起停重启操作 B.可以添加和卸载服务 C可设置不常用的服务隐藏或提示(正确答案) D 可查看服务的当前状态
3.FusionInsight HD 集群升级,以下描述正确的有?(多选)
A 升级过程中不可以手工操作主备 OMS倒换(正确答案)
B 集群内所有主机的root账户密码要保持一致(正确答案)
C 保持网络畅通,避免因网络问题导致升级异常(正确答案)
D观察期不能做扩容(正确答案)
4.fusioninsight HD 的loader在创建作业时,连接器(connector)有什么作用?
A.确定有哪些转换步骤
B.提供优化参数,提高数据导入导出性能
C配置作业如何与外部数据源进行连接(正确答案)
D配置作业如何与内部数据源进行连接
5.下列哪个HDFS命令可用于检测数据块的完整性?
A.hdfs fsck /(正确答案)
B.hdfs fsck / -delete
C.hdfs dfsadmin -report
D.hdfs balancer-threshold 1
6.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?
A.yarn scheduler capacity root QueueA user-limit-factor
B.yarn scheduler capacity root QueueA minimum-user-limit-percent
C.yarn scheduler capacity root QueueA state
D.yarn scheduler capacity root QueueA maximum-capacity(正确定位)
7.Flume的数据流可以根据header 的信息发送到不同的channel中.
A.正确 (正确答案) B,错误
8.Fusioninsight Manager 与外部管理平台对接时,支持哪些接口?(多选)
A.SNMP (正确答案)
B.VPN
C.BGP
D.Syslog(正确答案)
9.Hbase的数据文件HFile中的一个KeyValue格式包含哪些信息?(多选)
A.Key (正确答案)
B.Value(正确答案)
C.TimeStamp(正确答案)
D.Key Type(正确答案)
10.FusionInsight HG集群规划设计时,集群有150个节点,并且采用双平面组网部署,对于该集群网络带宽要求的描述,下列描述正确的有?(多选)
A.业务平面所有节点都使用10GE网络(正确答案)
B,管理平面中控制节点使用10GE网络
C.管理平面中数据节点使用10GE网络(正确答案)
D.管理平面中控制节点使用10GE网络
E.管理平面中管理节点使用10GE网络(正确答案)
11.FusionInsight系统中Hive支持的存储格式包括?(多选)
A.HFile
B.TextFile(正确答案)
C.SequenceFile(正确答案)
D.RCFile(正确答案).
12.Spark任务的每个stage可划分为job,划分的标记是shuffle.
A.正确 B.错误(正确答案)
13.FusionInsight Manager 对服务的配置功能说法不正确的是?
A.服务级别的配置可对所有实例生效
B.实例级别的配置只针对本实例生效
C.实例级别的配置对其它实例也生效(正确答案)
D.配置保存后需要重启服务才生效
14.FusionInsight HD部署Solr时,如果选择索引存放在本地磁盘,建议给每个SolrServer实例的数据目录单独挂载磁盘,并且磁盘为RAID0或RAID5.
A.对(正确答案) B.错
15.关于FusionInsight HD安装流程正确的是?
A.安装Manager--执行preinstall--LLD工具进行配置---安装集群--安装后检查--安装后配置
B.LLD工具进行配置--执行reinstall--安装Manager--安装集群--安装后检查--安装后配置(正确答案)
C.安装Manager--LLD工具进行配置--执行preinstall--安装集群--安装后检查--安装后配置
D.LLD工具进行配置--执行preinstall--安装集群--安装Manager--安装后检查--安装后配置
16.关于Kerberos部署,描述正确的是?
A.Kerberos仅有一个角色
B.Kerberos服务在同一个节点上有两个实例(正确答案)
C.Kerberos服务采用主备模式部署
D.Kerberos服务必须和LDAP服务部署在同一个节点上
17.某银行规划的FusionInsight HD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划多少最为合理?
A.87(正确答案)
B.85
C.90
D.86
18.安装FusionInsight HD软件包前,必须在本节点/etc/hosts文件中配置集群所有节点的主机名称与业务IP的映射关系.
A.正确(正确答案) B.错误
19.客户IT系统中FusionInsight HD集群有150个节点,每个节点12块磁盘(不做RAID,不包括OS盘),每个磁盘大小1T,只安装HDFS,按照默认配置最大可存储多少数据?
A.1764TB
B.1800TB
C.600TB
D,500TB(正确答案)
20.FusionInsight HD节点不支持哪种主机操作系统?
A.Suse
B.RedHat 6.5
C.CentOS 6.4
D.Ubuntu 11.0.4(正确答案)
21.FusionInsight HD中,如果需要检查当前登录HBase的用户和权限组,可以在HBase shell中执行什么命令?
A.use_permission
B.whoami(正确答案)
C.who
D.get_user
22.FusionInsight HD产品在部署Kerberos和LDAP服务时,一下描述正确的是?(多选)
A.部署Kerberos服务之前,必须先部署LDAP服务(正确答案)
B.LDAP服务必须和Kerberos服务部署在同一个节点
C.Kerberos服务和LDAP服务部署到同一个节点利于数据访问,有助于性能提升(正确答案)
D.LDAP服务可以多个集群共享
23.FusionInsight HD Manager界面Hive日志收集,哪个选项不正确?
A.可指定实例进行日志收集,比如指定单独收集MetaStore的日志
B.可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志
C.可指定节点IP进行日志收集,例如仅下载某个ip的日志
D.可指定特定用户进行日志收集,例如仅下载userA用户产生的日志(正确答案)
24.华为FusionInsight HD集群中,Spark 服务可以从以下哪些服务读取数据?(多选)
A.YARN
B.HDFS(正确答案)
C.Hive(正确答案)
D.HBase(正确答案)
25.如果YARN集群中只有Default ,QueueA和QueueB子队列时,那么允许讲他们的容量分别设置为60%,25%和22%.
A.正确 B.错误(正确答案)
26.FusionInsight HD系统中,关于Solr索引的存储部署策略,一下说法正确的有?(多选)
A.利用HDFS数据存储可靠性和易于扩容的特点优先选择索引存储于HDFS.(正确答案)
B.不论Solr索引存储在HDFS上还是存储在本地磁盘,在同一个节点上都必须要部署5个Solr实例,根据
C.当对实时索引录入速度要求较高时,可选择索引存放于本地磁盘.(正确答案)
D.当索引数据存放在HDFS上时,SolrServer实例与DataNode实例部署在同一个节点上.(正确答案)
27.FusionInsight HD三层组网适合多少节点的集群规模?
A.30节点一下7
B,100节点以上
C.100~200节点
D.200节点以上(正确答案)
28.FusionInsight HD系统中,Kerberos仅用于组件间服务安全认证.
A.正确
B.错误(正确答案)