第二周总结
在上周完成了CentOS虚拟机的配置和Hadoop的基本环境搭建之后,本周我进一步配置了YARN、MySQL和Hive。这些步骤的完成,使我对大数据处理和管理工具的使用有了更深入的理解。
配置YARN
YARN是Hadoop的资源管理框架,它能够管理集群资源并调度作业。以下是我配置YARN的具体步骤:
-
修改
yarn-site.xml
文件:在Hadoop的配置目录($HADOOP_HOME/etc/hadoop
)下,编辑yarn-site.xml
文件,添加以下内容:<configuration> <property> <name>yarn.resourcemanager.address</name> <value>localhost:8032</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
-
修改
mapred-site.xml
文件:编辑mapred-site.xml
文件,将以下内容添加到配置中:<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
-
启动YARN:执行以下命令启动YARN:
start-yarn.sh
安装和配置MySQL
MySQL是一个流行的关系型数据库管理系统,下面是我在CentOS上安装和配置MySQL的步骤:
-
安装MySQL:使用YUM包管理器安装MySQL:
sudo yum install mysql-server
-
启动MySQL服务:安装完成后,启动MySQL服务并设置开机自启动:
sudo systemctl start mysqld sudo systemctl enable mysqld
-
配置MySQL安全性:运行安全脚本以增强MySQL安装的安全性:
sudo mysql_secure_installation
-
创建数据库和用户:登录MySQL并创建用于Hive的数据库和用户:
CREATE DATABASE hive; CREATE USER 'hiveuser'@'localhost' IDENTIFIED BY 'hivepassword'; GRANT ALL PRIVILEGES ON hive.* TO 'hiveuser'@'localhost'; FLUSH PRIVILEGES;
安装和配置Hive
Hive是一个数据仓库基础设施,提供数据的总结、查询和分析功能,以下是安装和配置Hive的步骤:
-
下载和解压Hive:从Apache官方网站下载Hive安装包,并解压到指定目录:
wget https://downloads.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz tar -xzvf apache-hive-3.1.2-bin.tar.gz -C /usr/local mv /usr/local/apache-hive-3.1.2-bin /usr/local/hive
-
配置环境变量:在
.bashrc
文件中添加以下内容:export HIVE_HOME=/usr/local/hive export PATH=$PATH:$HIVE_HOME/bin
-
配置Hive:编辑
hive-site.xml
文件,添加MySQL的JDBC连接信息:<configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hiveuser</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>hivepassword</value> </property> </configuration>
-
初始化Metastore:执行以下命令初始化Hive的Metastore:
schematool -initSchema -dbType mysql
第二周的学习中,我成功配置了YARN、MySQL和Hive,使Hadoop生态系统更加完善。通过这些配置工作,我不仅掌握了YARN的资源管理和作业调度功能,还学会了如何使用MySQL作为Hive的Metastore,从而实现数据仓库管理。这些技能将为我未来的大数据处理和分析打下坚实的基础。
本文来自博客园,作者:赵千万,转载请注明原文链接:https://www.cnblogs.com/zhaoqianwan/p/18300645
千万千万赵千万