摘要:
Spark是什么?答案:Apache Spark是一个快速、通用的大数据处理引擎,它提供了大规模数据集的内存计算和分布式计算能力。Spark可以处理各种数据源,如HDFS、Hive、Cassandra等,并提供了丰富的API和工具集,用于批处理、流处理、机器学习、图处理等多种计算场景。 Spark的 阅读全文
摘要:
什么是Hive?答案:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 Hive的数据存储在哪里?答案:Hive的数据通常存储在Hadoop分布式文件系统(HDFS)上。Hive将HDFS上的数据映射成表格形式,并提供类似SQL的查询语 阅读全文
摘要:
什么是Zookeeper?答案:Zookeeper是一个分布式协调服务,主要用于管理和协调分布式系统中的各种服务和进程。它提供了一个集中式的配置管理、分布式同步、组服务等机制,使得分布式系统中的各种服务和进程能够协同工作。 Zookeeper的主要组件有哪些?答案:Zookeeper的主要组件包括Z 阅读全文
摘要:
Kafka是什么?它用于什么场景?答案:Kafka是一个分布式流平台,用于构建实时数据流管道和应用。它主要用于处理和传输大规模的流数据,例如日志、事件和其他类型的数据。Kafka广泛应用于大数据处理、实时流处理、消息队列等领域。 Kafka的主要组件有哪些?它们的作用是什么?答案:Kafka的主要组 阅读全文
摘要:
Playbook 概述 Ansible ad-hoc 可以通过命令行形式远程管理其他主机 适合执行一些临时性简单任务 Ansible playbook 中文名称叫 剧本 将经常需要执行的任务写入一个文件(剧本) 剧本中可以包含多个任务 剧本写好后,我们随时调用剧本,执行相关的任务名称 playboo 阅读全文
![Ansible - [06] Playbook](https://img2024.cnblogs.com/blog/1729889/202401/1729889-20240124172239877-5522679.png)
摘要:
主配置文件 ansible.cfg 修改sudo相关配置,在实际工作中,可能使用ansible时,所使用的用户并不是root用户,而是管理员给的一个普通用户,所以需要考虑ansible相关配置文件需要怎么写才能支持日常工作。 [defaults] inventory=~/ansible/hosts 阅读全文
![Ansible - [05] 配置文件详解](https://img2024.cnblogs.com/blog/1729889/202401/1729889-20240124172213989-640254958.png)
摘要:
sudo sudo,以超级管理员或其他人的身份执行命令 基本流程 管理员需要先授权(修改/etc/sudoers文件) 普通用户以sudo的形式执行命令 可以通过sudo -l查看授权情况 配置suddoer:vim /etc/sudoers,进行如下配置,jerry用户可以无需输入密码即以root 阅读全文
![Ansible - [04] 关于sudo的一些配置](https://img2024.cnblogs.com/blog/1729889/202401/1729889-20240124172150870-883700137.png)