摘要:
容错方式 错误始终会出现,不可避免,但可以尽最大可能延迟发生和降低错误的影响。 消除单点 实现系统更高的可用性,首先要消除单点,通过负载均衡分配流量,部署多个业务服务,存多份数据。 节点数越多,可用性就越高,根据实际情况避免浪费资源。 特性开关 实现简单的特性开关,通过配置文件或者程序中的一个静态变 阅读全文
摘要:
Prometheus 相关命令 docker network create monitoring mkdir -p /etc/prometheus vim /etc/prometheus/prometheus.yml docker run -itd --name prometheus \ --net 阅读全文
摘要:
安装Helm https://helm.sh/zh/docs/ https://github.com/helm/helm/releases https://get.helm.sh/helm-v3.16.2-linux-amd64.tar.gz 在 master 节点安装Helm [root@k8s- 阅读全文
摘要:
安装Docker-CE 修改repo源 修改为国内阿里源以提高安装速度 sed -e 's|^mirrorlist=|#mirrorlist=|g' \ -e 's|^#baseurl=http://dl.rockylinux.org/$contentdir|baseurl=https://mirr 阅读全文
摘要:
触发方式 jenkins自带的job触发方式 Generic Webhook Trigger插件 在需要外界其他系统触发Jenkins任务的场景,通常使用Generic Webhook Trigger插件来配置 Jenkins 触发器 Generic Webhook Trigger 插件允许使用 W 阅读全文
摘要:
安装Jenkins 主节点下载和安装Jenkins LTS版本 本机信息 [root@localhost ~]# cat /etc/system-release Rocky Linux release 9.4 (Blue Onyx) [root@localhost ~]# [root@localho 阅读全文
摘要:
1. AIOps定义 AIOps是智能运维(Artificial Intelligence forITOperations)的英文缩写。 当今,专业厂商根据自身理解和商业目的,分别给出了各具特色的AIOps定义。 主要关键字:IT运维、人工智能 (AI)、机器学习(ML)、自然语言处理(NLP)、大 阅读全文
摘要:
Create Terraform infrastructure with Docker How to init/plan/apply/destroy an NGINX webserver with Terraform. create .tf files. terraform.tf This file 阅读全文
摘要:
前言 什么是云? 借助云计算将基础设施视为视为软件并使用,具备可编程资源、动态伸缩能力、随用随付的优势。 传统方式:通过公司网络访问和管理本地部署的服务器、存储、数据库、应用程序等软硬件资源 云计算:通过互联网使用和管理云服务提供商的存储、服务器、数据库、应用程序等 云计算的优势 将资本支出转变为可 阅读全文
摘要:
01 - 05 01 - 操作日志 可设置日志类型TF_LOG和日志保存路径TF_LOG_PATH,将详细的日志打印到stderr来获取调试信息。 TF_LOG支持五种可用值,TRACE,DEBUG,INFO,WARN,ERROR,分别代表五种不同的日志级别,其中TRACE表示最详细的日志。 exp 阅读全文
摘要:
Terraform State Terraform可以根据state跟踪托管资源,默认文件存储在本地(local),可以使用backend定义远程的存储(remote)。 状态文件:terraform.tfstate、terraform.tfstate.backup State文件 terrafor 阅读全文
摘要:
Functions函数 https://developer.hashicorp.com/terraform/language/functions Terraform语言包括许多内置函数,可以从表达式中调用这些函数来转换。 函数调用的一般语法是函数名后跟括号中以逗号分隔的参数:function(arg 阅读全文
摘要:
Variable变量 官方文档: https://developer.hashicorp.com/terraform/language/values Terraform 运行时会读取工作目录中所有的 *.tf, *.tfvars文件,所有变量不应在单个文件中去,应分类在不同的文件中。 通过varia 阅读全文
摘要:
Terraform语法 官方文档:https://developer.hashicorp.com/terraform/language Terraform配置文件 配置文件支持两种格式HCL(HashiCorp Configuration Language)、JSON HCL格式后缀名以.tf结尾, 阅读全文
摘要:
云厂商资源 Terraform通过Provider管理基础设施,使用Provider与云供应商API进行交互。 每个Provider都包含相关的资源和数据源。 支持列表 官方文档: Provider列表:https://registry.terraform.io/browse/providers A 阅读全文
摘要:
调试 terraform fmt 格式化当前目录的tf文件内容格式,并列出已进行格式化的文件列表 -diff选项,显示格式更改的差异 -recursive选项,在所有子目录递归执行 terraform validate 验证配置的语法有效性,检查和定位错误出现的详细位置和原因 -json选项,以js 阅读全文
摘要:
开发环境配置 Note:安装环境为windows系统64位笔记本电脑 1.安装适用于 Windows 的 Terraform: https://developer.hashicorp.com/terraform/install 2.下载 Terraform: https://releases.has 阅读全文
摘要:
前言 云计算 主要提供计算服务,例如服务器、存储、数据库、网络等等; 对于云服务,通常只需使用多少支付多少,从而帮助降低运营成本,使基础设施更有效地运行,并能根据业务需求的变化调整对服务的使用。 公有云: 多租户面向个人或企业由第三方云服务商托管和运营。 私有云: 专供一个企业或组织使用的云计算资源 阅读全文
摘要:
科学思考的范式、模式与方法 在不断发展的内外环境中,具备适应性和创造力地应用科学思考的范式、模式和方法,至关重要。 依据实际形式,灵活运运用,以独特的方式和视角审视问题,更全面、创新地思考问题,发现潜在信息并得出创新性的解决方案。 科学范式 科学范式是科学探究和理论发展的基础框架,每种范式都伴随着特 阅读全文
摘要:
微服务要素 软件开发生命周期,涵盖需求、设计、开发、部署、运维等环节。 构建一个强健、完备的应用开发和运维架构,面临一系列的挑战: 技术选型、服务划分、敏捷开发、代码管理、服务治理、质量保证等 * 微服务容器化的生产环境整体解决方案 * 开发环境与生产环境的一致性:主机环境、软件版本、参数配置、网络 阅读全文
摘要:
01 - 从IT运维到IT运营 主动式运维相比被动式运维,其关键在于从被动解决问题变为主动防控风险,在于持续总结优化,将运维活动延伸到系统运行全周期,形成改进闭环。 通过总结、反馈、优化等活动避免问题再次发生。 具体体现在从“从IT运维到IT运营”的转变。 传统的IT运维管理更多是被动式“维待',面 阅读全文
摘要:
Harbor 简介 Harbor 是一个用于存储和分发 Docker 镜像的企业级 Registry 服务器,可以用来构建企业内部的 Docker 镜像仓库。 具有企业需要的一些功能特性,如镜像同步复制、漏洞扫描和权限管理等。 https://goharbor.io/ https://goharbo 阅读全文
摘要:
日志备份管理 作为历史数据的最终保存地,备份系统自身的可用性及数据存储策略显得格外重要。 如果实现本地数据双备份和重要数据跨机房复制后,那么在任何情况下均能保留一份可用副本。 关键要素 备份策略 过期时间 离线归档 恢复验证 数据分类 生产环境中备份数据可以归类为日志文件、数据文件、镜像文件等 日志 阅读全文
摘要:
1 - 趋势与本义 随着技术的发展, 基础设施和应用程序之间的界限会变得越来越模糊, "服务"管理也将变得更加全面和简单。 通过实施DevOps可以便捷地搭建包含交付流水线的研发协作平台,可以快速实现商业价值。 在这一过程中,反对将DevOps绝对理论化、模型化,而是坚持DevOps的实践性和灵活性 阅读全文
摘要:
应用系统评估 基本情况 应用系统配置信息完备程度 环境: 网络带宽、部署地点、部署机房等 硬件: 内存、硬盘、CPU等 软件: 操作系统、数据库、中间件等 文档: 开发文档、用户文档、产品文档等 服务: 业务服务时段、批量运行时间、停机维护时间、交易高峰时间等 应用:应用服务目录、应用支持系统、应用 阅读全文
摘要:
问题管理 问题的报告、受理、分派、督促、反馈、解决、跟踪、总结等工作过程 面对的问题 疲于解决重复性事件和问题 缺乏运维自动化:跟踪效率低,问题流转过程长; 流程性工作繁重:缺乏沉淀,难以形成问题库和深度挖掘分析底层原因和问题间关系 难以把控运维全局:不利于工作总结和持续优化 应用问题的一些基本定义 阅读全文
摘要:
通过 grep 命令查看指定配置内容 grep -vE '^#|^' <filename> # 显示指定的内容(非空行、非注释) # -E 表示 "或" 的关系 # "^" 表示行首,"^#" 表示以#开头的行 # "' <filename> # 显示指定的内容(非空行、非注释) # -E 表示 "或" 的关系 # "^" 表示行首,"^#" 表示以#开头的行 # "" 表示行尾,"^$" 表示空行 通过 stat 命令显示文件状态信息 # 可 阅读全文
摘要:
Confluence Confluence 是一个团队工作区,可有效融合知识与协作。 动态页面为您的团队提供一个场所,可用来创建、收集和协同处理任何项目或创意。 空间有助于您的团队构造、整理和共享工作,让每一位团队成员能够洞悉系统知识,并且访问实现最佳工作成果所需的信息。 官方信息 Confluen 阅读全文
摘要:
基于Jira的敏捷管理 产品Backlog梳理 创建用户故事、独立任务和子任务: 对应的项目产品PO和Master创建用户故事; 对应的敏捷团队成员创建自己的独立任务和子任务 用户故事拆分与估算: PO或Master将用户故事拆分和估算的结果按照用户故事”三段论”录入Jira。 进入产品Backlo 阅读全文
摘要:
Jira Jira 是敏捷项目管理工具,团队可使用该工具放心地规划、跟踪、发布和支持出色的软件。 作为整个开发生命周期的单一数据源,为自主团队提供情景信息,助力团队在与更大的业务目标保持关联的同时快速采取行动。 无论是用于管理简单的项目,还是用于支持 DevOps 实践,Jira 都能让团队轻松推进 阅读全文