1、什么是Maven?
自动化构建工具,专注服务于java平台的项目构建和依赖管理。
2、使用Maven的好处以及原因?
maven可以根据配置文件的参数自动的导入所需要的依赖,快捷方便,省时省力。
Maven帮我们自动化构建,抽象构建过程,提供构建任务实现,
最大化的消除了构建的重复,帮助我们标准化构建过程,简化了学习成本,
跨平台,对外提供一致的操作接口
3、使用哪三个向量在Maven的仓库中唯一的确定一个Maven工程?
groupId (组织域名)、artifactId(包名)、version(版本号)
1、groupld : 公司或组织的域名倒序+当前项目名称
2、artifactld : 当前项目的模块名称
3、version : 当前模块的版本
4、Maven仓库有哪几种?
本地仓库:自己在本机创建的maven仓库
远程仓库:私服:在公司或局域网的仓库,
中央仓库:最具权威的全世界通用的maven维护的仓库,
中央仓库的镜像:是各大洲、或者有能力的企业、学校所搭建、维护的仓库、相 当于重要仓库的拷贝
5、请简述Maven几种依赖范围?
compile(默认范围):main,test 目录下的java代码可以访问这个范围的依赖
部署到Tomcat服务器上运行时要放在WEB-IN的lib目录下
test:测试依赖范围
provided:已提供依赖范围
runtime:运行时依赖范围
system:系统依赖范围
6、请简述镜像仓库的作用?
选用离自己距离更近的仓库或者网络更加流畅的仓库来进行导入依赖,主要是为了提升导入速度
7、请简述为什么Maven可以帮助我们自动化的构建项目?
通过配置文件进行源选择,以配置文件中的参数与其组成一个绝对路径,
然后从这个路径上进行导入依赖。
8、使用Maven的好处以及原因?
maven可以根据配置文件的参数自动的导入所需要的依赖,快捷方便,省时省力。
9、Maven中的坐标是什么?
由配置信息参数所组成的一个导入依赖的绝对路径
10、Maven几种仓库有什么区别吗?
本地仓库:本地仓库就是开发者本地已经下载下来的或者自己打包所有jar包的依赖仓库,本地仓库路径配置在maven对应的conf/settings.xml配置文件。
中央仓库:中央仓库即maven默认下载的仓库地址,是maven维护的,默认的中央仓库地址是:http://repo1.maven.org/maven2,这个地址设置在maven的源码配置文件中。
镜像仓库:镜像仓库就是指自己公司的maven仓库或国内的各种大型开源仓库,是由各大厂商进行维护的,比中央仓库使用方便,并且依赖导入速度更快
11、请简述Maven核心概念值pom是什么意思?
Project Object Model,项目对象模型
12、依靠什么可以在Maven仓库中确定一个唯一的Maven工程?
依靠Maven坐标,其表示为groupld+artifactld+version
2、请简述几种Maven仓库的主要区别?
本地仓库: 为本机的所有maven项目服务 远程仓库: (1)私服 架设在局域网环境 为局域网范围内的所有maven项目服务 (2)中央仓库 架设在英特网下 为全球的maven项目服务 (3)中央仓库的镜像 架设在各大洲的 为中央仓库分担流量 减轻了中央仓库的压力 并且更快的响应客户的请求;
3、请简述配置镜像仓库的原因
镜像仓库可以为中央仓库分担流量,减轻中央仓库的负担,同时也可以更快的响应用户的请求,提高用户访问速度。
4、Maven可以对Java程序进行自动化构建的原因是?
(1)Maven存在约定好的目录结构,特定的目录存放的是特定的文件,当编译运行时,程序只要到约定好的目录下找到文件即可,这就是Maven可以实现自动化构建的原因。
------------------------
1、大数据有哪些特点?
valume(大量)
velocity(高速)
variety(多样)
value(低价值密度)
2、什么是大数据?
指无法在一定的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
3、大数据是用来解决什么的?
主要解决,海量数据的存储和海量数据的分析计算问题。
4、What is Hadoop?
分布式系统基础架构
5、Hadoop有哪些优势?
高可靠性:hadoop底层维护多个数据副本,即使hadoop某个计算元素或 存储出现故障,也不会导致数据的丢失
高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点
高效性 :在MapReduce的思想下,Hadoop是并行工作的,以加快任务处 理速度
6、sudo命令用处?
可为Hadoop用户增加管理员权限,方便不熟,避免比较棘手的权限问题
7、使用sudo时有几点需要注意的?
用户在执行sudo命令时要求输入账号密码,如果验证失败,sudo命令将会退出
8、Hadoop 2个组件-HDFS\YARN,1个思想(框架)MapReduce,它们的组成架构。
HDFS: NameNode(nn)存储文件的元数据
DataNode(dn)在本地系统存储文件块数据
Secondary NameNode(2nn) 每隔一段时间对NameNode元 数据备份
YARN :ResourceManager
Nodemanager
ApplicationMaster
Container
MapReduce: MapReduce将计算过程分为两个阶段,Map和Reduce
map阶段并行处理输入数据
Reduce阶段对Map结果进行汇总
9、中大型企业,大数据部门都由什么组成?
大数据部门组织结构:平台组,数据仓库组,实时组,数据挖掘组,报表开发组