HOUHUILIN

2024年1月18日

摘要： Python Flume DataX HDFS 数仓建模分层：ODS、DIM、DWD、DWS、APS Kettle、Informatica SQL（Oracle、MySQL）阅读全文

posted @ 2024-01-18 10:46 HOUHUILIN 阅读(4) 评论(0) 推荐(0) 编辑

2024年1月17日

摘要： node_heart_check.sh #!/bin/bash scriptPath=$(dirname "$0") for ip in `cat /etc/hosts | grep 主机名关键字 | awk '{print $2}'`;do # ping命令返回3次,自行中断 ping -c 3 阅读全文

posted @ 2024-01-17 22:37 HOUHUILIN 阅读(15) 评论(0) 推荐(0) 编辑

Java - Hello World

摘要： 1、使用NotePad++（或者其他文本编辑器）编辑如下内容 public class HelloWorld{ public static void main(String[] args){ System.out.println('Hello,World'); } } 2、使用cmd打开，并切换到文阅读全文

posted @ 2024-01-17 21:55 HOUHUILIN 阅读(2) 评论(0) 推荐(0) 编辑

MySQL Q&A - [02] windows上MySQL的安装路径变更之后无法启动MySQL服务

摘要：参考：https://blog.csdn.net/weixin_45271005/article/details/130091868 Step1：首先，变更之前，需要保证MySQL服务是停止运行的 Step2：MySQL安装路径变更之后，需要修改系统环境变量中MYSQL_HOME的值 Step3：在阅读全文

posted @ 2024-01-17 21:00 HOUHUILIN 阅读(101) 评论(0) 推荐(0) 编辑

键盘

摘要：阅读全文

posted @ 2024-01-17 17:53 HOUHUILIN 阅读(2) 评论(0) 推荐(0) 编辑

2024年1月15日

Ansible - [10] Vault（加密&解密）

摘要：

加密文件 Ansible 有时需要访问一些敏感数据，如密码、Key等使用ansible-vault可以加密和解密数据 # 创建测试文件 [root@control ansible]# echo 123456 > data.txt # 加密文件 [root@control ansible]# ans 阅读全文

posted @ 2024-01-15 17:48 HOUHUILIN 阅读(78) 评论(0) 推荐(0) 编辑

Ansible - [09] 高级语法

摘要：

error 处理机制默认 ansible 在遇到 error 会立刻停止 playbook [root@control ansible]# cat ~/ansible/error.yml - hosts: test tasks: - name: start a service that does 阅读全文

posted @ 2024-01-15 17:34 HOUHUILIN 阅读(15) 评论(0) 推荐(0) 编辑

Ansible - [08] 模块应用

摘要：

firewalld 模块使用firewalld模块可以配置防火墙策略 [root@control ~]# cat ~/ansible/firewall.yml - hosts: agent tasks: - name: install firewalld. yum: name: firewalld 阅读全文

posted @ 2024-01-15 15:30 HOUHUILIN 阅读(32) 评论(0) 推荐(0) 编辑

2024年1月13日

Ansible - [07] 定义变量的几种方式

摘要：

题记部分 Ansible 支持十几种定义变量的方式 Inventory 变量 Host Facts 变量 Register 变量 Playbook 变量 Playbook 提示变量变量文件命令行变量一、Inventory 变量 1、定义变量（在主机清单配置文件中进行定义） [root@cont 阅读全文

posted @ 2024-01-13 14:16 HOUHUILIN 阅读(46) 评论(0) 推荐(0) 编辑

2024年1月11日

Spark - spark on yarn 的作业提交流程

摘要： YarnClient YarnCluster 客户端（Client）通过YARN的ResourceManager提交应用程序。在此过程中，客户端进行权限验证，生成Job ID和资源上传路径，并将这些信息返回给客户端。客户端将jar包、配置文件、第三方包等文件上传到指定的HDFS路径。完成后，客户端阅读全文

posted @ 2024-01-11 22:38 HOUHUILIN 阅读(105) 评论(0) 推荐(0) 编辑

Spark - 面试题

摘要： Spark是什么？答案：Apache Spark是一个快速、通用的大数据处理引擎，它提供了大规模数据集的内存计算和分布式计算能力。Spark可以处理各种数据源，如HDFS、Hive、Cassandra等，并提供了丰富的API和工具集，用于批处理、流处理、机器学习、图处理等多种计算场景。 Spark的阅读全文

posted @ 2024-01-11 22:21 HOUHUILIN 阅读(33) 评论(0) 推荐(0) 编辑

Hive - 面试题

摘要：什么是Hive？答案：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。 Hive的数据存储在哪里？答案：Hive的数据通常存储在Hadoop分布式文件系统（HDFS）上。Hive将HDFS上的数据映射成表格形式，并提供类似SQL的查询语阅读全文

posted @ 2024-01-11 22:16 HOUHUILIN 阅读(29) 评论(0) 推荐(0) 编辑

Zookeeper - 面试题

摘要：什么是Zookeeper？答案：Zookeeper是一个分布式协调服务，主要用于管理和协调分布式系统中的各种服务和进程。它提供了一个集中式的配置管理、分布式同步、组服务等机制，使得分布式系统中的各种服务和进程能够协同工作。 Zookeeper的主要组件有哪些？答案：Zookeeper的主要组件包括Z 阅读全文

posted @ 2024-01-11 22:11 HOUHUILIN 阅读(13) 评论(0) 推荐(0) 编辑

Kafka - 面试题

摘要： Kafka是什么？它用于什么场景？答案：Kafka是一个分布式流平台，用于构建实时数据流管道和应用。它主要用于处理和传输大规模的流数据，例如日志、事件和其他类型的数据。Kafka广泛应用于大数据处理、实时流处理、消息队列等领域。 Kafka的主要组件有哪些？它们的作用是什么？答案：Kafka的主要组阅读全文

posted @ 2024-01-11 22:07 HOUHUILIN 阅读(13) 评论(0) 推荐(0) 编辑

Ansible - [06] Playbook

摘要：

Playbook 概述 Ansible ad-hoc 可以通过命令行形式远程管理其他主机适合执行一些临时性简单任务 Ansible playbook 中文名称叫剧本将经常需要执行的任务写入一个文件（剧本）剧本中可以包含多个任务剧本写好后，我们随时调用剧本，执行相关的任务名称 playboo 阅读全文

posted @ 2024-01-11 18:26 HOUHUILIN 阅读(7) 评论(0) 推荐(0) 编辑

别在最好的年纪，辜负了最好的自己。

公告