08 2021 档案

摘要:参考:https://blog.51cto.com/yuweibing/2285553 高可用指标 有多种方法可以提高可用性。最优雅的解决方案是重写您的软件,以便您可以同时在多个主机上运行它。软件本身需要有一种方法来检测错误并进行故障转移。如果您只想提供只读网页,那么这相对简单。但是,这通常很复杂, 阅读全文
posted @ 2021-08-31 17:14 Varden 编辑
摘要:参考:https://blog.51cto.com/yuweibing/2285553 使用外部ceph集群里创建的存储池 ceph1,登陆web管理界面,如下图: 注意,ceph-external这个pool就是创建的外部ceph存储的pool。 创建ceph认证文件: 在任意一个节点上运行: m 阅读全文
posted @ 2021-08-31 17:03 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3499271 九、一些常用的Ceph/OSD命令 1)常见命令查看Ceph/OSD状态 root@pve-node1:~# ceph df root@pve-node1:~# ceph osd df root@pve-nod 阅读全文
posted @ 2021-08-31 14:54 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3499271 八、OSD磁盘故障排查案例 第一步:Ceph的监控界面发现OSD掉线,但是并没有产生告警 本项目在客户现场稳定运行了半年,基本上没有出现过故障,这次去客户现场巡查,在Ceph的WEB UI监控界面中,发现了Ce 阅读全文
posted @ 2021-08-31 14:43 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3499271 七、Ceph分布式存储 Ceph以其先进的去中心化设计,成为了分布式块存储领域的佼佼者,它可以将多台服务器中的硬盘聚合成一个集群,对外可提供文件存储、块存储、对象存储等多种形式,Ceph的另一个特点是数据采用多 阅读全文
posted @ 2021-08-31 13:59 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3499271 六、集群组建 6.1 PVE集群部署要求 PVE集群部署有一定的要求,以下是《Proxmox6.2手册》对PVE集群部署的要求,摘录如下: 1)所有节点必须可以相互访问彼此的UDP 5404和UDP 5405端 阅读全文
posted @ 2021-08-31 11:07 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3425275 五、虚拟网络 5.1 PVE虚拟网络拓扑 某某公司超融合项目的虚拟网络的核心架构是在PVE虚拟化平台上创建虚拟交换机(OVS类型)、创建虚拟主机,并与物理交换机、物理路由器一起,组建管理网以及业务网。虚拟主机通 阅读全文
posted @ 2021-08-31 08:36 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3425275 四、物理网络 本项目超融合平台主要由3个节点服务器集群组建,且使用Ceph搭建分布式存储,为保证平台可靠性要求,为保证性能要求,为保证虚拟机迁移速率等,强烈建立采用全万兆交换机部署。同时,IPMI网络单独部署交 阅读全文
posted @ 2021-08-30 17:11 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3425275 三、PVE安装与基础配置 3.1 PVE安装七步曲 本项目中,3个节点服务器都需要安装PVE虚拟化平台,限于篇幅,这里只演示节点1服务器的PVE安装过程。 第一步:选择红框中的选项,敲回车键,安装PVE,如图7 阅读全文
posted @ 2021-08-30 16:10 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3425275 一、某某公司超融合项目整体网络拓扑 某省某某公司科技有限责任公司研发测试平台超融合项目整体网络拓扑,如图1所示: 节点1~3服务器 节点1~3服务器采用超融合架构,主要用于研发测试平台,部署在某某公司办公室对面 阅读全文
posted @ 2021-08-30 15:46 Varden 编辑
摘要:参考:https://blog.51cto.com/u_14742102/3606723 一、什么是超融合?超融合具体包括哪些组件? 所谓“超融合”架构,其实就是“服务器虚拟化+分布式存储”架构,也就是说超融合技术包含了服务器虚拟化技术和分布式存储技术。 服务器虚拟化技术目前在企业数据中心已有广泛的 阅读全文
posted @ 2021-08-30 15:19 Varden 编辑
摘要:参考:https://blog.csdn.net/hanziqing0630/article/details/118678155 一、Proxmox Backup Server(pbs)介绍 Proxmox Backup Server(pbs)是与pve配套的备份解决方案,用于备份和恢复虚拟机、容器 阅读全文
posted @ 2021-08-30 10:18 Varden 编辑
摘要:参考:https://blog.csdn.net/hanziqing0630/article/details/114262035 一、Proxmox Virtual Environment介绍 Proxmox VE 是用于企业虚拟化的开源服务器管理平台。它在单个平台上紧密集成了KVM虚拟机管理程序和 阅读全文
posted @ 2021-08-28 16:57 Varden 编辑
摘要:参考:https://www.proxmox.com/en/proxmox-mail-gateway Proxmox Mail Gateway 是领先的开源电子邮件安全解决方案,可帮助您保护您的邮件服务器免受所有电子邮件威胁,从它们出现的那一刻起。 灵活的架构与用户友好的基于 Web 的管理界面相结 阅读全文
posted @ 2021-08-27 14:25 Varden 编辑
摘要:参考:https://www.proxmox.com/en/proxmox-backup-server Proxmox Backup Server 是一种企业备份解决方案,用于备份和恢复虚拟机、容器和物理主机。 通过支持增量、完全重复数据删除的备份,Proxmox Backup Server 显着降 阅读全文
posted @ 2021-08-27 14:22 Varden 编辑
摘要:参考: https://www.proxmox.com/en/proxmox-ve https://blog.51cto.com/u_14742102/3207448 简介 Proxmox VE 是一个运行虚拟机和容器的平台。 这是 基于 Debian Linux,完全开源。 最大 灵活性,我们实施 阅读全文
posted @ 2021-08-27 14:14 Varden 编辑
摘要:参考:http://www.mydlq.club/article/8/ 创建Helm执行方法 这里提前创建好执行 helm 的方法,将其简单封装一下用于执行流水线时候,调用此方法,执行对应的 Helm 操作。 方法名:helmDeploy() 可配参数: init: 是否为执行 helm 初始化 u 阅读全文
posted @ 2021-08-27 09:57 Varden 编辑
摘要:参考:http://www.mydlq.club/article/59/ 示例场景 例如,要在 Jenkins 中创建 alibaba-xxx 与 weixin-xxx 两个项目组,并且 Jenkins 中存在两个用户 xiao-ming 与 xiao-li,其中 xiao-ming 只能看到 al 阅读全文
posted @ 2021-08-26 17:30 Varden 编辑
摘要:参考:http://www.mydlq.club/article/7/ 配置系统默认邮件参数 Jenkins Location 设置 设置参数: Jenkins URL: Jenkins 地址,用于发送邮件时写入内容之中 系统管理员邮件地址: 邮件服务器账户,其中系统管理员邮件地址一定要和“User 阅读全文
posted @ 2021-08-26 17:10 Varden 编辑
摘要:参考:http://www.mydlq.club/article/60/ 全量与差量备份选择其一即可,推荐全量备份,差量备份可能会出现一些意外问题。 阅读全文
posted @ 2021-08-26 16:52 Varden 编辑
摘要:参考:http://www.mydlq.club/article/47/ 一、CICD 流程图参考 二、必要的插件说明 Git: Jenkins 安装中默认安装 Git 插件,所以不需要单独安装。利用 git 工具可以将 github、gitlab 等等的地址下载源码。 Docker: Jenkin 阅读全文
posted @ 2021-08-26 16:26 Varden 编辑
摘要:必要的RBAC权限 apiVersion: v1 kind: ServiceAccount metadata: name: jenkins-admin #ServiceAccount名 namespace: cicd #指定namespace,一定要修改成你自己的namespace labels: 阅读全文
posted @ 2021-08-26 08:59 Varden 编辑
摘要:更新源: https://updates.jenkins.io/update-center.json ## 国外源,实际环境中也可以使用,下载速度还可以 https://updates.jenkins-zh.cn/update-center.json ## 国内源,实际使用中会出现403错误,原因不 阅读全文
posted @ 2021-08-25 16:07 Varden 编辑
摘要:Dockerfile模板示例 FROM jenkinsci/blueocean:1.24.8 MAINTAINER Varden USER root RUN sed -i 's/dl-cdn.alpinelinux.org/mirrors.aliyun.com/g' /etc/apk/reposit 阅读全文
posted @ 2021-08-25 16:05 Varden 编辑
摘要:参考:https://www.jenkins.io/zh/doc/book/installing/ 部署命令 docker run \ --name jenkins-blueocean \ -u root \ -d \ --restart=always \ -p 8080:8080 \ -p 500 阅读全文
posted @ 2021-08-25 14:21 Varden 编辑
摘要:参考:https://jimmysong.io/kubernetes-handbook/practice/jenkins-ci-cd.html 流程说明 应用构建和发布流程说明。 1.用户向 Gitlab 提交代码,代码中必须包含 Dockerfile 2.将代码提交到远程仓库(远程仓库可以直接 w 阅读全文
posted @ 2021-08-25 10:18 Varden 编辑
摘要:#架构和组件 #Docker部署 参考: https://docs.gitlab.com/ee/install/docker.html 部署脚本: #!/bin/bash # set -u mkdir -p /srv/gitlab/{config,logs,data} ## 在宿主机上创建数据、日志 阅读全文
posted @ 2021-08-25 08:13 Varden 编辑
摘要:参考:https://docs.gitea.io/zh-cn/ 简介 一款极易搭建的自助 Git 服务。 易安装 您除了可以根据操作系统平台通过 二进制运行,还可以通过 Docker 或 Vagrant,以及 包管理 安装。 跨平台 任何 Go 语言 支持的平台都可以运行 Gitea,包括 Wind 阅读全文
posted @ 2021-08-24 17:07 Varden 编辑
摘要:参考: https://goharbor.io/docs/2.0.0/install-config/ 安装docker-compose 参考:https://docs.docker.com/compose/install/ curl -L "https://github.com/docker/com 阅读全文
posted @ 2021-08-24 15:29 Varden 编辑
摘要:##共享磁盘故障转移 ##文件系统(块设备)复制 ##预写式日志传送 基于文件的日志传送 流复制 ##逻辑复制 ##基于触发器的主-备复制 Londiste Slony-I ##基于语句的复制中间件 Pgpool-II Continuent Tungsten ##异步多主控机复制 Bucardo # 阅读全文
posted @ 2021-08-24 14:17 Varden 编辑
摘要:选项说明 常用选项: -z, --gzip: 使用gzip工具(解)压缩,后缀一般为.gz -c, --create: tar打包,后缀一般为.tar -f, --file=: 后面立刻接打包或压缩后得到的文件名 -x, --extract: 解包命令,与 -c 对应 -p: 保留备份数据的原本权限 阅读全文
posted @ 2021-08-24 14:02 Varden 编辑
摘要:同步命令 # rsync -vzrtopg --progress hadoop@192.168.5.172::hadoop /usr/local/hadoop/etc/hadoop #在服务端touch一个文件,同步后就会出现 使用crontab实现定时自动同步功能 # vim /etc/rsync 阅读全文
posted @ 2021-08-24 11:40 Varden 编辑
摘要:主要配置文件 # vim /etc/default/rsync RSYNC_ENABLE=true # cp /usr/share/doc/rsync/examples/rsyncd.conf /etc/ 配置文件内容解释 # sample rsyncd.conf configuration fil 阅读全文
posted @ 2021-08-24 11:28 Varden 编辑
摘要:安装system-config-kickstart图形化工具并生成应答文件: # yum install system-config-kickstart 将应答文件保存至以下目录并做进一步修改: # mkdir /var/www/html/ks # vim /var/www/html/ks/ks.c 阅读全文
posted @ 2021-08-24 10:32 Varden 编辑
摘要:#组件介绍 xinetd -- 对服务访问进行控制,这里主要是控制tftp dhcp -- 动态分配IP tftp-server -- 从服务器端下载pxelinux.0、default文件 syslinux -- 用于网络引导 httpd -- 在网络上提供安装源,也就是镜像文件中的内容 注:这里 阅读全文
posted @ 2021-08-24 10:25 Varden 编辑
摘要:系统环境 系统版本:CentOS 7.8 旧内核版本:3.10.0-1062 升级后的内核版本:4.4.218-1 安装 ELRepo 最新版本 载入公钥 $ rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org 安装 ELRepo 最 阅读全文
posted @ 2021-08-24 09:47 Varden 编辑
摘要:安装SELinux配置GUI工具: yum install policycoreutils-gui 命令行查看状态: [root@localhost ~]# sestatus SELinux status: enabled SELinuxfs mount: /sys/fs/selinux SELin 阅读全文
posted @ 2021-08-24 09:36 Varden 编辑
摘要:# step 1: 安装必要的一些系统工具 ``` sudo yum install -y yum-utils device-mapper-persistent-data lvm2 ``` # Step 2: 添加软件源信息 ``` sudo yum-config-manager --add-rep 阅读全文
posted @ 2021-08-24 09:30 Varden 编辑
摘要:step 1: 安装必要的一些系统工具 sudo yum install -y yum-utils device-mapper-persistent-data lvm2 Step 2: 添加软件源信息 sudo yum-config-manager --add-repo https://mirror 阅读全文
posted @ 2021-08-24 09:15 Varden 编辑
摘要:备份默认源: # mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup # mv /etc/yum.repos.d/CentOS-AppStream.repo /etc/yum.repos.d/Ce 阅读全文
posted @ 2021-08-24 09:07 Varden 编辑
摘要:yum provides ifconfig yum install -y net-tools yum provide vim yum install -y vim-enhanced yum provides wget yum install -y wget yum provides tree yum 阅读全文
posted @ 2021-08-24 09:00 Varden 编辑
摘要:网络配置文件路径: /etc/sysconfig/network-scripts /etc/sysconfig/network-scripts/ifcfg-lo DEVICE=lo IPADDR=127.0.0.1 NETMASK=255.0.0.0 NETWORK=127.0.0.0 # If y 阅读全文
posted @ 2021-08-24 08:59 Varden 编辑
摘要:查询命令由哪个软件包提供: yum provides 'lsb_release' 阅读全文
posted @ 2021-08-24 08:56 Varden 编辑
摘要:解决办法:此问题安装Deltarpm包(增量 RPM 套件)即可解决,当然您也可以先使用provides命令,查看是哪个包提供applydeltarpm。 yum provides '*/applydeltarpm' yum install deltarpm -y 阅读全文
posted @ 2021-08-24 08:50 Varden 编辑
摘要:yum -y install bash-completion 阅读全文
posted @ 2021-08-24 08:48 Varden 编辑
摘要:源配置文件路径: /etc/apk/repositories 官方源示例: https://dl-cdn.alpinelinux.org/alpine/v3.13/main https://dl-cdn.alpinelinux.org/alpine/v3.13/community 阿里云源示例: h 阅读全文
posted @ 2021-08-24 08:39 Varden 编辑
摘要:# date -s "2017-08-23 17:18:00" ## 修改系统时间 # hwclock -w ## 修改硬件时钟 # hwclock -r ## 查看硬件时钟 阅读全文
posted @ 2021-08-24 08:36 Varden 编辑
摘要:使用 nohup 运行命令可以使命令永久的执行下去直至命令退出,和用户终端没有关系。 例如,我们断开 SSH 连接都不会影响他的运行,注意了 nohup 没有后台运行的意思, 加上 & 才是后台运行。 nohup COMMAND & 这样就能使命令永久的在后台执行直至退出。 操作示例: # nohu 阅读全文
posted @ 2021-08-24 08:33 Varden 编辑
摘要:PS: cron 默认发送的邮件和任务输出的信息会占用大量本地磁盘空间,实际环境中必须合理配置定时任务。 禁止 cron 发送邮件 执行 crontab -e 编辑模式修改或注释以下行: MAILTO="" ## 指定邮箱发送位置 任务输出重定向 执行 crontab -e 在任务命令末尾加上以下内 阅读全文
posted @ 2021-08-24 08:23 Varden 编辑
摘要:以管理员方式打开cmd.exe,运行如下命令: netsh winsock reset catalog netsh int ip reset reset.log hit 阅读全文
posted @ 2021-08-24 08:13 Varden 编辑
摘要:``` find /nfs/backup/*.sql -type f -ctime +N | xargs rm -f ``` 阅读全文
posted @ 2021-08-24 08:11 Varden 编辑
摘要:动态查看进程的内存使用量 top -d 1 -p <pid> [,pid ...] ## -d设置为delay 1s,默认是delay 3s PS: 如果想根据内存使用量进行排序,可以shift + m(Sort by memory usage)。 静态查看 pmap命令 pmap <pid> ps 阅读全文
posted @ 2021-08-24 08:02 Varden 编辑
摘要:示例: # netstat -ant | awk '/^tcp/ {++S[$NF]} END {for(a in S) print (a,S[a])}' # ss -s 输出信息: LISTEN 44 CLOSE_WAIT 57 TIME_WAIT 3 ESTABLISHED 1275 TCP连接 阅读全文
posted @ 2021-08-23 17:37 Varden 编辑
摘要:以管理员方式打开cmd,运行如下命令: route -p add 10.19.0.0 mask 255.255.0.0 10.19.6.254 metric 3 删除路由: route delete 10.19.0.0 mask 255.255.0.0 10.19.6.254 metric 3 阅读全文
posted @ 2021-08-23 17:27 Varden 编辑
摘要:取文件第一行: head -1 /var/lib/mysql/binlog.index 取文件第二行: head -2 /var/lib/mysql/binlog.index | tail -n 1 取文件倒数第一行: tail /var/lib/mysql/binlog.index -n 1 取文 阅读全文
posted @ 2021-08-23 17:19 Varden 编辑
摘要:rsync -P --rsh=ssh home.tar 192.168.205.34:/tmp/home.tar 阅读全文
posted @ 2021-08-23 17:16 Varden 编辑
摘要:使用内存前10: # ps aux | sort -k4nr | head -n 10 使用CPU前10: # ps aux | sort -k3nr | head -n 10 查看内存和应用名: # ps -aux | sort -k4nr | head -n 10 | tr -s ' '| cu 阅读全文
posted @ 2021-08-23 17:11 Varden 编辑
摘要:列出所有端口 (包括监听和未监听的) 列出所有端口 netstat -a 列出所有 tcp 端口 netstat -at 列出所有 udp 端口 netstat -au 列出所有处于监听状态的 Sockets 只显示监听端口 netstat -l 只列出所有监听 tcp 端口 netstat -lt 阅读全文
posted @ 2021-08-23 16:56 Varden 编辑
摘要:gzip 是 Linux 系统中经常用来对文件进行压缩和解压缩的命令,通过此命令压缩得到的新文件,其扩展名通常标记为“.gz”。 再强调一下,gzip 命令只能用来压缩文件,不能压缩目录,即便指定了目录,也只能压缩目录内的所有文件。 gzip 命令的基本格式如下: # gzip [选项] 源文件 命 阅读全文
posted @ 2021-08-23 16:45 Varden 编辑
摘要:# /etc/crontab: system-wide crontab # Unlike any other crontab you don't have to run the `crontab' # command to install the new version when you edit 阅读全文
posted @ 2021-08-23 16:38 Varden 编辑
摘要:示例 # vmstat 1 10 字段说明 procs r 列表示运行和等待cpu时间片的进程数,如果长期大于1,说明cpu不足,需要增加cpu。 b 列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。 cpu(表示cpu的使用状态) us 列显示了用户方式下所花费 CPU 时间的百分比 阅读全文
posted @ 2021-08-23 16:34 Varden 编辑
摘要:Ubuntu安装 # apt install sysstat 查看平均负荷 示例: # sar -q 1 10 字段说明: runq-sz: 运行队列的长度(等待运行的进程数) plist-sz: 进程列表中进程(processes)和线程(threads)的数量 ldavg-1: 最后1分钟的系统 阅读全文
posted @ 2021-08-23 16:24 Varden 编辑
摘要:nc -ul 6000 # 在一台主机上运行作为服务端 nc -u <host_ip> 6000 # 在另一台主机上连接 nc -vuz <host_ip> 1194 # 测试目标端口是否正常 nc -vu <host_ip> 1194 # 向UDP端口发送消息 tcpdump -i eth0 -s 阅读全文
posted @ 2021-08-23 15:59 Varden 编辑
摘要:# apt install iputils-arping # 安装工具 # arping -h # 获取帮助信息 Usage: arping [options] <destination> Options: -f quit on first reply 等到第一个回复就退出 -q be quiet 阅读全文
posted @ 2021-08-23 15:49 Varden 编辑
摘要:主流服务器厂商:X86/Non-X86 浪潮(X86) 按产品形态 机架服务器:浪潮英信服务器NF5280M5 - 主要适用于虚拟化,数据库,HPC,大数据分析,AI/深度学习,内存计算,CDN等应用场景 多节点服务器:浪潮英信服务器i48 - 主要适用于超融合,大数据分析,HPC,分布式存储,是全 阅读全文
posted @ 2021-08-23 15:43 Varden 编辑
摘要:创建和管理 LVM 要创建一个 LVM 系统,一般需要经过以下步骤: 1、 创建分区 使用分区工具(如:fdisk 等)创建 LVM 分区,方法和创建其他一般分区的方式是一样的,区别仅仅是 LVM 的分区类型为 8e。 使用 fdisk 创建分区,根据设备文件的绝对路径(/dev/hda)进入分区管 阅读全文
posted @ 2021-08-23 15:23 Varden 编辑
摘要:前面谈到,LVM 是在磁盘分区和文件系统之间添加的一个逻辑层,来为文件系统屏蔽下层磁盘分区布局,提供一个抽象的盘卷,在盘卷上建立文件系统。首先我们讨论以下几个 LVM 术语: 物理存储介质(The physical media) 这里指系统的存储设备:硬盘,如:/dev/hda1、/dev/sda 阅读全文
posted @ 2021-08-23 14:51 Varden 编辑
摘要:LVM 是 Logical Volume Manager(逻辑卷管理)的简写,它由 Heinz Mauelshagen 在 Linux 2.4 内核上实现。LVM 将一个或多个硬盘的分区在逻辑上集合,相当于一个大硬盘来使用,当硬盘的空间不够使用的时候,可以继续将其它的硬盘的分区加入其中,这样可以实现 阅读全文
posted @ 2021-08-23 14:43 Varden 编辑
摘要:物理磁盘被格式化为PV,空间被划分为一个个的PE 不同的PV加入到同一个VG中,不同PV的PE全部进入到了VG的PE池内 LV基于PE创建,大小为PE的整数倍,组成LV的PE可能来自不同的物理磁盘 LV现在就直接可以格式化后挂载使用了 LV的扩充缩减实际上就是增加或减少组成该LV的PE数量,如果操作 阅读全文
posted @ 2021-08-23 14:41 Varden 编辑
摘要:umount不了的原因一般是由于有程序有用户在占用。 解决方法: 首先查找谁在占用 # fuser /mnt/nfs ## 得到进程号 查找进程 # ps –ef | grep <进程号> 杀死进程 # kill -9 <进程号> 然后 umount,如不行执行 umount –f /mnt/nfs 阅读全文
posted @ 2021-08-23 14:37 Varden 编辑
摘要:随着硬盘容量、速度的快速发展,硬盘的可靠性问题越来越重要,今天的单块硬盘存储容量可轻松达到1TB,硬盘损坏带来的影响非常巨大。 不同的文件系统(xfs,reiserfs,ext3)都有自己的检测和修复工具。 检测之前可以先使用 dmesg 命令查看有没有硬件I/O故障的日志,如果有,先用 fsck 阅读全文
posted @ 2021-08-23 14:11 Varden 编辑
摘要:pssh提供OpenSSH和相关工具的并行版本。包括pssh,pscp,prsync,pnuke和pslurp。该项目包括psshlib,可以在自定义应用程序中使用。 pssh是python写的可以并发在多台机器上批量执行命令的工具,它的用法可以媲美ansible的一些简单用法,执行起来速度比ans 阅读全文
posted @ 2021-08-23 11:48 Varden 编辑
摘要:Settings Sync:一款能够同步自己vscode设置的插件 Chinese:中文语言包 open in browser:在浏览器打开HTML文件 TSLint:Typescript语法检查 Prettier:代码格式化 IntelliJ IDEA Keybindings:IDEA风格的快捷键 阅读全文
posted @ 2021-08-23 11:17 Varden 编辑
摘要:区块选择: v 字符选择,会将光标经过的地方反白选择 V(大写) 行选择,会将光标经过的行反白选择(常用) [Ctrl]+v 区块选择,可以用长方形的方式选择资料 y 将反白的地方复制起来 d 将反白的地方删除掉 光标移动: h,j,k,l 左、下、上、右 0 第一个非空字符前 ^ 第一个非空字符上 阅读全文
posted @ 2021-08-23 11:14 Varden 编辑
摘要:编辑命令 Ctrl + a :移到命令行首 < 常用命令 Ctrl + e :移到命令行尾 < 常用命令 Ctrl + f :按字符前移(右向) Ctrl + b :按字符后移(左向) Alt + f :按单词前移(右向) < 常用命令 Alt + b :按单词后移(左向) < 常用命令 Ctrl 阅读全文
posted @ 2021-08-23 10:57 Varden 编辑
摘要:日志收集系统架构 日志收集方案说明 阅读全文
posted @ 2021-08-22 08:48 Varden 编辑
摘要:监控运维方案说明 阅读全文
posted @ 2021-08-22 08:43 Varden 编辑
摘要:目前,您只能监控Docker本身。您目前无法使用Docker目标监控应用程序。 将Docker守护程序配置为Prometheus目标 { "metrics-addr" : "127.0.0.1:9323", "experimental" : true } 配置Prometheus # my glob 阅读全文
posted @ 2021-08-20 16:24 Varden 编辑
摘要:运行时目录和存储驱动程序 { "data-root": "/mnt/docker-data", "storage-driver": "overlay" } 指定DNS服务器 { "dns": ["8.8.8.8", "8.8.4.4"] } 配置日志驱动程序 json-file的日志格式为JSON, 阅读全文
posted @ 2021-08-20 16:21 Varden 编辑
摘要:创建配置文件 /etc/systemd/system/docker.service.d/docker.conf 覆盖默认的启动脚本,内容如下: [Service] ExecStart= ExecStart=/usr/bin/dockerd 阅读全文
posted @ 2021-08-20 16:05 Varden 编辑
摘要:资源限制 如果容器尝试使用的内存多于系统可用的内存,则可能会遇到内存不足异常(OOME),并且容器或Docker守护程序可能会被内核OOM杀手杀死。要防止这种情况发生,请确保您的应用程序在具有足够内存的主机上运行. 您可以通过以下方式降低OOME导致系统不稳定的风险: 在将应用程序投入生产之前,请执 阅读全文
posted @ 2021-08-20 15:59 Varden 编辑
摘要:查看docker对象占用存储空间 docker system df 清理所有停止的容器、至少有一个容器未使用的所有网络、所有孤岛镜像和孤岛构建缓存: docker system prune 可用选项: --volumes 清理卷 --force, -f 删除时不需要确认 单独清理所有停止的容器:(谨 阅读全文
posted @ 2021-08-20 15:50 Varden 编辑
摘要:创建卷 docker volume create --driver local \ --opt type=nfs \ --opt o=addr=<NFS服务器地址>,nolock,soft,rw \ --opt device=:<共享目录全路径> \ <卷名> 挂载卷 docker service 阅读全文
posted @ 2021-08-20 15:41 Varden 编辑
摘要:[ { "ID": "q3o2za0hm43jvqaj8ia2ftx5m", "Version": { "Index": 52663 }, "CreatedAt": "2020-12-11T08:08:53.428411794Z", "UpdatedAt": "2020-12-13T07:40:39 阅读全文
posted @ 2021-08-20 15:35 Varden 编辑
摘要:给指定节点添加label: docker node update <node_id> --label-add manager=yes 获取所需镜像: docker pull portainer/portainer-ce:2.0.0-alpine docker pull portainer/agent 阅读全文
posted @ 2021-08-20 15:23 Varden 编辑
摘要:给所有节点添加label: docker node update --label-add registry=yes <node_id> compose模板: version: "3" services: registry: image: registry:2.6.2 environment: - " 阅读全文
posted @ 2021-08-20 15:16 Varden 编辑
摘要:NFS服务器配置 # mkdir -p /nfs # vim /etc/exports /nfs *(rw,sync,no_root_squash,no_subtree_check) # /etc/init.d/nfs-kernel-server reload # showmount -e 示例 # 阅读全文
posted @ 2021-08-20 14:59 Varden 编辑
摘要:AVAILABILITY 的三种状态 Active:调度器能够安排任务到该节点 Pause:调度器不能够安排任务到该节点,但是已经存在的任务会继续运行 Drain:调度器不能够安排任务到该节点,而且会停止已存在的任务,并将这些任务分配到其他 Active 状态的节点 MANAGER STATUS 的 阅读全文
posted @ 2021-08-20 14:22 Varden 编辑
摘要:一些操作命令: docker service create --replicas 3 --name redis --update-delay 10s redis:3.0.6 docker service inspect --pretty redis docker service update --i 阅读全文
posted @ 2021-08-20 14:17 Varden 编辑
摘要:初始化集群(在第一个管理节点操作) docker swarm init --advertise-addr <first_manager_node_ip> 部分输出信息: Swarm initialized: current node (mo2p7vnjhzg68g6wzejozdomo) is no 阅读全文
posted @ 2021-08-20 13:56 Varden 编辑
摘要:基本架构 Ingress Network Ingress + LB 阅读全文
posted @ 2021-08-20 11:42 Varden 编辑
摘要:安装工具 # Ubuntu apt-get install sysstat iotop # CentOS yum install sysstat iotop iostat iostat -x 1 10 这个只能计算总的IO,没有单独某个进程的。 iotop 这个可以针对单个进程进行查看。 iotop 阅读全文
posted @ 2021-08-20 11:32 Varden 编辑
摘要:安装 apt-get install supervisor 配置文件:/etc/supervisor/conf.d/http_server.conf [inet_http_server] port=0.0.0.0:9001 username=admin password=admin 配置文件:/et 阅读全文
posted @ 2021-08-20 11:23 Varden 编辑
摘要:apt-get remove docker docker-engine docker.io apt-get install apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://d 阅读全文
posted @ 2021-08-20 11:12 Varden 编辑
摘要:基础镜像选择 alpine(musl libc) slim(debian + glibc) scratch(null) busybox:glibc Go FROM golang:alpine COPY hello.go . RUN go build hello.go FROM alpine COPY 阅读全文
posted @ 2021-08-20 11:05 Varden 编辑
摘要:配置文件 $ mkdir /var/lib/registry $ docker run -d \ --restart=always \ -p 5000:5000 \ -e REGISTRY_HTTP_ADDR=0.0.0.0:5000 \ --name registry \ -v /var/lib/ 阅读全文
posted @ 2021-08-20 10:55 Varden 编辑
摘要:在Linux操作上,docker守护进程配置文件的默认位置是/etc/docker/daemon.json。可以通过–config-file标志指定非默认位置。下面是Linux操作系统上允许的配置选项完整示例: { “authorization-plugins”: [], “data-root”: 阅读全文
posted @ 2021-08-20 10:51 Varden 编辑
摘要:1、设置安装源 apt-get -y install --no-install-recommends apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://apt.dockerpr 阅读全文
posted @ 2021-08-20 10:40 Varden 编辑
摘要:1. 安装或升级 apt-get install -y rsyslog 2. 配置文件 /etc/rsyslog.conf 3. 日志写入本地文件 3.1 Rsyslog默认是将日志存储在本地文件,所以不需要修改配置文件 3.2 测试 3.2.1 开个shell执行命令tail -f /var/lo 阅读全文
posted @ 2021-08-20 10:25 Varden 编辑
摘要:Lucene查询语法 Kibana查询语言基于Lucene查询语法。下面是一些提示: 为了执行一个文本搜索,可以简单的输入一个文本字符串。例如,如果你想搜索web服务器的日志,你可以输入关键字"safari",这样你就可以搜索到所有有关"safari"的字段。 为了搜索一个特定字段的特定值,可以用字 阅读全文
posted @ 2021-08-20 10:20 Varden 编辑
摘要:汉化文件路径 /usr/share/kibana/x-pack/plugins/translations/translations/zh-CN.json 在kibana.yml配置文件中添加以下选项 i18n.locale: "zh-CN" 阅读全文
posted @ 2021-08-20 10:09 Varden 编辑
摘要:USERNAME [a-zA-Z0-9._-]+ USER %{USERNAME} INT (?:[+-]?(?:[0-9]+)) BASE10NUM (?<![0-9.+-])(?>[+-]?(?:(?:[0-9]+(?:\.[0-9]+)?)|(?:\.[0-9]+))) NUMBER (?:% 阅读全文
posted @ 2021-08-20 10:06 Varden 编辑
摘要:/var/log/syslog 日志信息: Oct 18 22:53:08 C1-M620-16 systemd[31255]: Listening on GnuPG network certificate management daemon. grok表达式: ^%{SYSLOGBASE} %{G 阅读全文
posted @ 2021-08-20 09:58 Varden 编辑
摘要:配置文件:/etc/logstash/conf.d/logstash-indexer.conf input { #file { # path => [ "/var/log/*.log", "/var/log/messages", "/var/log/syslog" ] # type => "sysl 阅读全文
posted @ 2021-08-20 09:22 Varden 编辑
摘要:1.一个例子 项目日志生成在某个路径,如/var/log/project,里面有warn,info,error目录,分别对应不同级别的日志,需要采集这些日志。 需要采集特定格式的日志,如: [2018-11-24 08:33:43,253][ERROR][http-nio-8080-exec-4][ 阅读全文
posted @ 2021-08-20 09:15 Varden 编辑
摘要:安装 wget -c https://packages.elastic.co/curator/5/debian/pool/main/e/elasticsearch-curator/elasticsearch-curator_5.8.1_amd64.deb sudo dpkg -i elasticse 阅读全文
posted @ 2021-08-20 09:03 Varden 编辑
摘要:安装nginx apt-get install nginx 使用openssl创建一个管理员用户,例如“admin”,可以访问Kibana Web界面 echo "admin:`openssl passwd -apr1`" | tee -a /etc/nginx/conf.d/htpasswd.us 阅读全文
posted @ 2021-08-20 08:59 Varden 编辑
摘要:配置文件及目录说明 /etc/elasticsearch/log4j2.properties /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/jvm.options /etc/default/elasticsearch /usr/lib 阅读全文
posted @ 2021-08-20 08:47 Varden 编辑
摘要:shell脚本内容如下: #!/bin/bash # # 脚本名:clean.sh # 功能:用于清理日志数据 # 作者:Varden CONFIG_FILE=/home/scripts/config.yml ACTION_FILE=/home/scripts/action_file.yml /us 阅读全文
posted @ 2021-08-20 08:10 Varden 编辑
摘要:图1. 最简单架构 图2. Logstash 作为日志搜索器 图3. Beats 作为日志搜集器 图4. 引入消息队列机制的架构 图5. 基于 Filebeat 的 ELK 集群架构 阅读全文
posted @ 2021-08-19 21:11 Varden 编辑
摘要:查看索引数据: curl http://192.168.5.138:30200/_cat/indices 删除19号logstash的所有数据: curl -XDELETE 'http://192.168.5.138:30200/logstash-2017.06.19' 删除2个月之前的数据: _l 阅读全文
posted @ 2021-08-19 21:03 Varden 编辑
摘要:构建钉钉Webhook镜像 代码依赖文件:requirements.txt certifi==2018.10.15 chardet==3.0.4 Click==7.0 Flask==1.0.2 idna==2.7 itsdangerous==1.1.0 Jinja2==2.10 MarkupSafe 阅读全文
posted @ 2021-08-19 17:31 Varden 编辑
摘要:构建微信Webhook镜像 代码依赖文件:requirements.txt certifi==2018.10.15 chardet==3.0.4 Click==7.0 Flask==1.0.2 idna==2.7 itsdangerous==1.1.0 Jinja2==2.10 MarkupSafe 阅读全文
posted @ 2021-08-19 17:10 Varden 编辑
摘要:groups: - name: MySQLStatsAlert rules: - alert: MySQL is down expr: mysql_up == 0 for: 1m labels: severity: critical annotations: summary: "Instance { 阅读全文
posted @ 2021-08-19 15:51 Varden 编辑
摘要:Nov 19 15:32:28 k8s-node-4 kernel: [9063714.121381] nfs4_reclaim_open_state: 40 callbacks suppressed Nov 19 15:32:28 k8s-node-4 kernel: [9063714.12138 阅读全文
posted @ 2021-08-19 15:45 Varden 编辑
摘要:query.max-concurrency 20 最大支持的并发查询量。 storage.local.checkpoint-dirty-series-limit 5000 崩溃恢复时候,只恢复5000个时序数据,这样减少了prometheus的恢复时间。如果是SSD盘,可以适当增大这个值。 stor 阅读全文
posted @ 2021-08-19 15:42 Varden 编辑
摘要:参考: https://www.prometheus.wang/operator/use-custom-configuration-in-operator.html 在Prometheus Operator我们通过声明式的创建如Prometheus, ServiceMonitor这些自定义的资源类型 阅读全文
posted @ 2021-08-19 11:26 Varden 编辑
摘要:参考: https://www.prometheus.wang/operator/use-operator-manage-monitor.html 使用PrometheusRule定义告警规则 对于Prometheus而言,在原生的管理方式上,我们需要手动创建Prometheus的告警文件,并且通过 阅读全文
posted @ 2021-08-19 11:14 Varden 编辑
摘要:参考: https://www.prometheus.wang/operator/use-operator-manage-prometheus.html 创建Prometheus实例 当集群中已经安装Prometheus Operator之后,对于部署Prometheus Server实例就变成了声 阅读全文
posted @ 2021-08-19 10:59 Varden 编辑
摘要:参考: https://www.prometheus.wang/operator/what-is-prometheus-operator.html Prometheus Operator的工作原理 从概念上来讲Operator就是针对管理特定应用程序的,在Kubernetes基本的Resource和 阅读全文
posted @ 2021-08-19 10:37 Varden 编辑
摘要:参考: https://www.prometheus.wang/kubernetes/use-prometheus-monitor-kubernetes.html 下表中,梳理了监控Kubernetes集群监控的各个维度以及策略: 从Kubelet获取节点运行状态 Kubelet组件运行在Kuber 阅读全文
posted @ 2021-08-19 09:42 Varden 编辑
摘要:参考: https://www.prometheus.wang/kubernetes/service-discovery-with-kubernetes.html Kubernetes的访问授权 这里创建prometheus-rbac-setup.yml文件,并写入以下内容: apiVersion: 阅读全文
posted @ 2021-08-19 09:09 Varden 编辑
摘要:参考:https://www.prometheus.wang/kubernetes/kubernetes-with-minikube.html Kubernetes作为开源的容器编排工具,为用户提供了一个可以统一调度,统一管理的云操作系统。其解决如用户应用程序如何运行的问题。而一旦在生产环境中大量基 阅读全文
posted @ 2021-08-19 08:42 Varden 编辑
摘要:参考: https://www.prometheus.wang/kubernetes/kubernetes-with-minikube.html Kubenetes是一款由Google开发的开源的容器编排工具(GitHub源码),在Google已经使用超过15年(Kubernetest前身是Goog 阅读全文
posted @ 2021-08-19 08:42 Varden 编辑
摘要:参考: https://www.prometheus.wang/sd/service-discovery-with-relabel.html Prometheus的Relabeling机制 在Prometheus所有的Target实例中,都包含一些默认的Metadata标签信息。可以通过Promet 阅读全文
posted @ 2021-08-18 22:26 Varden 编辑
摘要:参考: https://www.prometheus.wang/sd/service-discovery-with-file.html 在Prometheus支持的众多服务发现的实现方式中,基于文件的服务发现是最通用的方式。这种方式不需要依赖于任何的平台或者第三方服务。对于Prometheus而言也 阅读全文
posted @ 2021-08-18 21:46 Varden 编辑
摘要:参考: https://www.prometheus.wang/sd/why-need-service-discovery.html 基于服务发现与注册中心动态发现监控目标 在不同的场景下,会有不同的东西扮演者代理人(服务发现与注册中心)这一角色。 比如在AWS公有云平台或者OpenStack的私有 阅读全文
posted @ 2021-08-18 21:37 Varden 编辑
摘要:参考: https://www.prometheus.wang/ha/alertmanager-high-availability.html 为了提升Promthues的服务可用性,通常用户会部署两个或者两个以上的Promthus Server,它们具有完全相同的配置包括Job配置,以及告警配置等。 阅读全文
posted @ 2021-08-18 21:15 Varden 编辑
摘要:参考: https://www.prometheus.wang/ha/prometheus-and-high-availability.html 基本HA:服务可用性 由于Promthues的Pull机制的设计,为了确保Promthues服务的可用性,用户只需要部署多套Prometheus Serv 阅读全文
posted @ 2021-08-18 17:41 Varden 编辑
摘要:参考: https://www.prometheus.wang/ha/scale-prometheus-with-federation.html 使用联邦集群 如上图所示,在每个数据中心部署单独的Prometheus Server,用于采集当前数据中心监控数据。并由一个中心的Prometheus S 阅读全文
posted @ 2021-08-18 17:22 Varden 编辑
摘要:参考: https://www.prometheus.wang/ha/prometheus-local-storage.html 本地存储 Prometheus 2.x 采用自定义的存储格式将样本数据保存在本地磁盘当中。如下所示,按照两个小时为一个时间窗口,将两小时内产生的数据存储在一个块(Bloc 阅读全文
posted @ 2021-08-18 16:41 Varden 编辑
摘要:参考: https://www.prometheus.wang/grafana/templating.html 变量 在Grafana中用户可以为Dashboard定义一组变量(Variables),变量一般包含一个到多个可选值。如下所示,Grafana通过将变量渲染为一个下拉框选项,从而使用户可以 阅读全文
posted @ 2021-08-18 16:00 Varden 编辑
摘要:参考: https://www.prometheus.wang/grafana/use_singlestat_panel.html Singlem Panel侧重于展示系统的当前状态而非变化趋势。如下所示,在以下场景中特别适用于使用SingleStat: 当前系统中所有服务的运行状态; 当前基础设施 阅读全文
posted @ 2021-08-18 15:26 Varden 编辑
摘要:参考: https://www.prometheus.wang/grafana/use_heatmap_panel.html Heatmap是是Grafana v4.3版本以后新添加的可视化面板,通过热图可以直观的查看样本的分布情况。在Grafana v5.1版本中Heatmap完善了对Promet 阅读全文
posted @ 2021-08-18 14:42 Varden 编辑
摘要:参考: https://www.prometheus.wang/grafana/use_graph_panel.html Graph面板通过折线图或者柱状图的形式,能够展示监控样本数据在一段时间内的变化趋势,因此其天生适合Prometheus中的Counter和Gauge类型的监控指标的可视化,对于 阅读全文
posted @ 2021-08-18 13:55 Varden 编辑
摘要:参考: https://www.prometheus.wang/grafana/grafana-panels.html 当选中数据源时,Panel会根据当前数据源类型加载不同的Query Editor界面。这里我们主要介绍Prometheus Query Editor,如下所示,当选中的数据源类型为 阅读全文
posted @ 2021-08-18 11:18 Varden 编辑
摘要:参考: https://www.prometheus.wang/grafana/grafana-intro.html 仪表盘(Dashboard) 通过数据源定义好可视化的数据来源之后,对于用户而言最重要的事情就是实现数据的可视化。在Grafana中,我们通过Dashboard来组织和管理我们的数据 阅读全文
posted @ 2021-08-18 10:59 Varden 编辑
摘要:参考: https://www.kubernetes.org.cn/8515.html 概述 当你的 Java 业务容器化上 K8S 后,如何对其进行监控呢?Prometheus 社区开发了 JMX Exporter 来导出 JVM 的监控指标,以便使用 Prometheus 来采集监控数据。本文将 阅读全文
posted @ 2021-08-18 10:44 Varden 编辑
摘要:参考: https://www.prometheus.wang/exporter/use-promethues-monitor-redis.html https://github.com/oliver006/redis_exporter https://grafana.com/grafana/das 阅读全文
posted @ 2021-08-18 09:53 Varden 编辑
摘要:参考:https://www.prometheus.wang/exporter/install_blackbox_exporter.html 我们监控主机的资源用量、容器的运行状态、数据库中间件的运行数据。 这些都是支持业务和服务的基础设施,通过白盒能够了解其内部的实际运行状态,通过对监控指标的观察 阅读全文
posted @ 2021-08-17 17:27 Varden 编辑
摘要:参考:https://www.prometheus.wang/exporter/use-promethues-monitor-mysql.html 监控数据库吞吐量 对于数据库而言,最重要的工作就是实现对数据的增、删、改、查。为了衡量数据库服务器当前的吞吐量变化情况。在MySQL内部通过一个名为Qu 阅读全文
posted @ 2021-08-17 16:54 Varden 编辑
摘要:参考:https://www.prometheus.wang/exporter/use-prometheus-monitor-container.html CAdvisor是Google开源的一款用于展示和分析容器运行状态的可视化工具。通过在主机上运行CAdvisor用户可以轻松的获取到当前主机上容 阅读全文
posted @ 2021-08-17 16:13 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/prometheus-recoding-rules.html 通过PromQL可以实时对Prometheus中采集到的样本数据进行查询,聚合以及其它各种运算操作。而在某些PromQL较为复杂且计算量较大时,直接使用PromQL 阅读全文
posted @ 2021-08-17 15:42 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/alert-manager-inhibit.html Alertmanager提供了方式可以帮助用户控制告警通知的行为,包括预先定义的抑制机制和临时定义的静默规则。 抑制机制 Alertmanager的抑制机制可以避免当某种问 阅读全文
posted @ 2021-08-17 15:33 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/alert-with-wechat.html Alertmanager已经内置了对企业微信的支持,我们可以通过企业微信来管理报警,更进一步可以通过企业微信和微信的互通来直接将告警消息转发到个人微信上。 prometheus官网 阅读全文
posted @ 2021-08-17 15:04 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/alert-with-smtp.html 邮箱应该是目前企业最常用的告警通知方式,Alertmanager内置了对SMTP协议的支持,因此对于企业用户而言,只需要一些基本的配置即可实现通过邮件的通知。 在Alertmanage 阅读全文
posted @ 2021-08-17 14:52 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/alert-manager-route.html route的完整定义如下: [ receiver: <string> ] [ group_by: '[' <labelname>, ... ']' ] [ continue: 阅读全文
posted @ 2021-08-17 14:35 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/alert-manager-config.html 在Alertmanager配置中一般会包含以下几个主要部分: 全局配置(global):用于定义一些全局的公共参数,如全局的SMTP配置,Slack配置等内容; 模板(tem 阅读全文
posted @ 2021-08-17 14:20 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/install-alert-manager.html global: resolve_timeout: 5m route: group_by: ['alertname'] group_wait: 10s group_inter 阅读全文
posted @ 2021-08-17 14:12 Varden 编辑
摘要:# my global config global: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_interval: 15s # E 阅读全文
posted @ 2021-08-17 14:06 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/prometheus-alert-rule.html 定义告警规则 一条典型的告警规则如下所示: groups: - name: example rules: - alert: HighErrorRate expr: job: 阅读全文
posted @ 2021-08-17 14:03 Varden 编辑
摘要:参考:https://www.prometheus.wang/alert/prometheus-alert-manager-overview.html Alertmanager除了提供基本的告警通知能力以外,还主要提供了如:分组、抑制以及静默等告警特性: 分组 分组机制可以将详细的告警信息合并成一个 阅读全文
posted @ 2021-08-17 13:43 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/prometheus-promql-functions.html irate()这样的函数,可以帮助我们计算监控指标的增长率。除了irate以外,Prometheus还提供了其它大量的内置函数,可以对时序数据进行丰富的处理。 阅读全文
posted @ 2021-08-17 10:28 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/prometheus-aggr-ops.html Prometheus还提供了下列内置的聚合操作符,这些操作符作用域瞬时向量。可以将瞬时表达式返回的样本数据进行聚合,形成一个新的时间序列。 sum (求和) min (最小值 阅读全文
posted @ 2021-08-17 09:50 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/prometheus-promql-operators-v2.html 使用PromQL除了能够方便的按照查询和过滤时间序列以外,PromQL还支持丰富的操作符,用户可以使用这些操作符对进一步的对事件序列进行二次加工。这些操 阅读全文
posted @ 2021-08-17 09:40 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/prometheus-query-language.html Prometheus通过指标名称(metrics name)以及对应的一组标签(labelset)唯一定义一条时间序列。指标名称反映了监控样本的基本标识,而lab 阅读全文
posted @ 2021-08-17 09:06 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/prometheus-metrics-types.html 了解了Prometheus的底层数据模型,在Prometheus的存储实现上所有的监控样本都是以time-series的形式保存在Prometheus内存的TSDB 阅读全文
posted @ 2021-08-17 08:38 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/what-is-prometheus-metrics-and-labels.html 通过Node Exporter暴露的HTTP服务,Prometheus可以采集到当前主机所有监控指标的样本数据。例如: # HELP no 阅读全文
posted @ 2021-08-17 08:16 Varden 编辑
摘要:转自:https://www.prometheus.wang/quickstart/why-monitor.html Prometheus是一个开源的完整监控解决方案,其对传统监控系统的测试和告警模型进行了彻底的颠覆,形成了基于中央化的规则计算、统一分析和告警的新模型。 相比于传统监控系统Prome 阅读全文
posted @ 2021-08-16 17:35 Varden 编辑
摘要:error_log stderr notice; worker_processes auto; events { multi_accept on; use epoll; worker_connections 1024; } stream { upstream kube_apiserver { ser 阅读全文
posted @ 2021-08-16 16:56 Varden 编辑
摘要:Inhibition:抑制是指当警报发出后,停止重复发送由此警报引发其他错误的警报的机制。抑制规则,是存在另一组匹配器匹配的情况下,静音其他被引发警报的规则。这两个警报,必须有一组相同的标签。 # Matchers that have to be fulfilled in the alerts to 阅读全文
posted @ 2021-08-16 16:48 Varden 编辑
摘要:安装配置: # cd /usr/local/bin/ # curl -O -L https://github.com/projectcalico/calicoctl/releases/download/v3.10.1/calicoctl # chmod +x calicoctl # mkdir /e 阅读全文
posted @ 2021-08-16 16:42 Varden 编辑
摘要:日志架构参考:https://www.cnblogs.com/varden/p/15084450.html fluentd部署清单示例 参考:https://github.com/kubernetes/kubernetes/tree/master/cluster/addons/fluentd-ela 阅读全文
posted @ 2021-08-16 14:50 Varden 编辑
摘要:参考: https://prometheus.io/docs/introduction/overview/ https://github.com/prometheus/prometheus https://www.prometheus.wang/ Prometheus 简介 Prometheus 是 阅读全文
posted @ 2021-08-16 13:32 Varden 编辑
摘要:转自:https://www.prometheus.wang/promql/prometheus-promql-best-praticase.html 4个黄金指标 Four Golden Signals是Google针对大量分布式监控的经验总结,4个黄金指标可以在服务级别帮助衡量终端用户体验、服务 阅读全文
posted @ 2021-08-16 10:17 Varden 编辑
摘要:参考: https://linkerd.io/2.10/getting-started/ https://github.com/linkerd/linkerd2/releases/ https://linkerd.io/2.10/features/ha/ https://linkerd.io/2.1 阅读全文
posted @ 2021-08-15 20:44 Varden 编辑
摘要:参考:https://github.com/kubernetes-csi/csi-driver-nfs 目前它只实现了CSI规范的最小值,并处于开发的alpha状态。 阅读全文
posted @ 2021-08-14 16:53 Varden 编辑
摘要:参考: https://github.com/ceph/ceph-csi 介绍 Ceph容器存储接口(CSI)驱动程序,用于RBD, CephFS。 通过kubernetes sidecar部署provisioner, attacher, resizer, driver-registrar 和 sn 阅读全文
posted @ 2021-08-14 16:09 Varden 编辑
摘要:参考:https://www.kubernetes.org.cn/6908.html 一、CNI 是什么 首先我们介绍一下什么是 CNI,它的全称是 Container Network Interface,即容器网络的 API 接口。 它是 K8s 中标准的一个调用网络实现的接口。Kubelet 通 阅读全文
posted @ 2021-08-14 13:34 Varden 编辑
摘要:参考:https://www.kubernetes.org.cn/9127.html 背景 K8s 原生支持一些存储类型的 PV,如 iSCSI、NFS、CephFS 等等,这些 in-tree 类型的存储代码放在 Kubernetes 代码仓库中。这里带来的问题是 K8s 代码与三方存储厂商的代码 阅读全文
posted @ 2021-08-14 10:41 Varden 编辑
摘要:参考:https://github.com/kubernetes-retired/external-storage/tree/master/ceph/cephfs(已停止更新并归档) 创建秘钥 ceph auth get-key client.admin > /tmp/secret kubectl 阅读全文
posted @ 2021-08-13 16:50 Varden 编辑
摘要:参考: https://github.com/kubernetes-sigs/nfs-subdir-external-provisioner 部署清单 RBAC清单 apiVersion: v1 kind: ServiceAccount metadata: name: nfs-client-prov 阅读全文
posted @ 2021-08-13 15:19 Varden 编辑
摘要:参考: 创建存储密钥 kubectl create secret generic ceph-secret --type="kubernetes.io/rbd" \ --from-literal=key='QVFEQ1pMdFhPUnQrSmhBQUFYaERWNHJsZ3BsMmNjcDR6RFZS 阅读全文
posted @ 2021-08-13 11:10 Varden 编辑
摘要:参考: https://github.com/kubernetes-sigs/metrics-server Metrics Server 是 Kubernetes 的可扩展、高效的容器资源指标来源 内置自动缩放管道。 Metrics Server 从 Kubelets 收集资源指标,并通过 在 Ku 阅读全文
posted @ 2021-08-13 09:36 Varden 编辑
摘要:参考: https://kubernetes.github.io/ingress-nginx/examples/ https://github.com/kubernetes/ingress-nginx/tree/main/docs/examples https://cloud.tencent.com 阅读全文
posted @ 2021-08-12 16:35 Varden 编辑
摘要:参考: https://kubernetes.github.io/ingress-nginx/user-guide/third-party-addons/opentracing/ 启用 NGINX 服务的请求,通过 OpenTracing 项目进行分布式跟踪。 使用第三方模块 opentracing 阅读全文
posted @ 2021-08-12 13:52 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/user-guide/tls/ TLS Secrets 每当我们引用 TLS Secrets时,我们指的是 PEM 编码的 X.509、RSA (2048) Secrets。 您可以使用以下命令生成自签名证书 阅读全文
posted @ 2021-08-12 11:51 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/user-guide/monitoring/ 前提条件 控制器应配置为导出指标 helm upgrade ingress-controller ingress-nginx/ingress-nginx \ -- 阅读全文
posted @ 2021-08-12 11:19 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/user-guide/ingress-path-matching/ 正则表达式支持 示例: apiVersion: networking.k8s.io/v1beta1 kind: Ingress metada 阅读全文
posted @ 2021-08-12 10:33 Varden 编辑
摘要:参考: https://kubernetes.github.io/ingress-nginx/deploy/baremetal/ https://raw.githubusercontent.com/kubernetes/ingress-nginx/controller-v0.48.1/deploy/ 阅读全文
posted @ 2021-08-12 10:09 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/user-guide/basic-usage/ apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: ingress-myservice 阅读全文
posted @ 2021-08-12 08:46 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/ 阅读全文
posted @ 2021-08-11 16:33 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/configmap/ 为了覆盖 config.go 中看到的 nginx-controller 配置值,您可以将键值对添加到 config-map 阅读全文
posted @ 2021-08-11 16:15 Varden 编辑
摘要:参考: https://cloud.tencent.com/developer/article/1761376 https://kubernetes.github.io/ingress-nginx/ https://github.com/kubernetes/ingress-nginx https: 阅读全文
posted @ 2021-08-11 15:40 Varden 编辑
摘要:参考:https://kubernetes.github.io/ingress-nginx/deploy/baremetal/#via-the-host-network 在没有可用的外部负载均衡器但不能使用 NodePorts 的设置中,可以配置 ingress-nginx Pod 使用它们运行的​ 阅读全文
posted @ 2021-08-11 08:45 Varden 编辑
摘要:参考:https://helm.sh/zh/docs/intro/using_helm/ 三大概念 Chart 代表着 Helm 包。它包含在 Kubernetes 集群内部运行应用程序,工具或服务所需的所有资源定义。你可以把它看作是 Homebrew formula,Apt dpkg,或 Yum 阅读全文
posted @ 2021-08-10 14:24 Varden 编辑
摘要:参考:https://helm.sh/zh/docs/intro/ 当前版本:v3.6.3 安装 查看Helm和对应支持的Kubernetes版本,您可以参考 Helm 版本支持策略(https://helm.sh/zh/docs/topics/version_skew/)。 用二进制版本安装 每个 阅读全文
posted @ 2021-08-10 11:19 Varden 编辑
摘要:K8s版本:v1.20 构建模板:Dockerfile FROM nginx:1.20-alpine MAINTAINER varden # 修改安装源 RUN sed -i 's@dl-cdn.alpinelinux.org@mirrors.aliyun.com@g' /etc/apk/repos 阅读全文
posted @ 2021-08-10 09:58 Varden 编辑
摘要:K8s版本:1.20.8 问题描述: # kubectl get componentstatuses Warning: v1 ComponentStatus is deprecated in v1.19+ NAME STATUS MESSAGE ERROR controller-manager Un 阅读全文
posted @ 2021-08-10 09:43 Varden 编辑
摘要:OS版本:Ubuntu 20.04.2 LTS 配置kubectl、helm、crictl等命令自动补全 # apt-get install -y bash-completion # locate bash_completion /usr/share/bash-completion/bash_com 阅读全文
posted @ 2021-08-10 09:05 Varden 编辑
摘要:OS版本:Ubuntu 18.04 LTS 确保每个节点上 MAC 地址和 product_uuid 的唯一性 你可以使用命令 ip link 或 ifconfig -a 来获取网络接口的 MAC 地址 可以使用 sudo cat /sys/class/dmi/id/product_uuid 命令对 阅读全文
posted @ 2021-08-10 08:50 Varden 编辑
摘要:参考:https://github.com/flannel-io/flannel 部署 For Kubernetes v1.17+ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentati 阅读全文
posted @ 2021-08-09 17:08 Varden 编辑
摘要:参考:https://docs.projectcalico.org/getting-started/kubernetes/flannel/flannel 注意:Calico 包括原生 VXLAN 功能,无需 Flannel。 如果您计划为 VXLAN 使用 Flannel,我们建议改为使用 IP-i 阅读全文
posted @ 2021-08-09 16:33 Varden 编辑
摘要:参考:https://docs.projectcalico.org/getting-started/clis/calicoctl/install 需要命令行工具calicoctl才能使用 Calico 的许多功能。 它用于管理 Calico 策略和配置,以及查看详细的集群状态。 除了资源管理, ca 阅读全文
posted @ 2021-08-09 16:11 Varden 编辑
摘要:参考:https://docs.projectcalico.org/getting-started/kubernetes/installation/config-options 自定义 Calico 清单 关于自定义 Calico 清单 每个清单都包含在 Kubernetes 集群中的每个节点上安装 阅读全文
posted @ 2021-08-09 15:39 Varden 编辑
摘要:参考:https://docs.projectcalico.org/getting-started/kubernetes/self-managed-onprem/onpremises 确定您的数据存储 Kubernetes API数据存储是Kubernetes工作负载推荐的数据存储。 注意 : 不建 阅读全文
posted @ 2021-08-09 14:48 Varden 编辑
摘要:参考:https://docs.projectcalico.org/getting-started/kubernetes/requirements 节点要求 x86-64、arm64、ppc64le 或 s390x 处理器 具有 Linux 内核 3.10 或更高版本 所需依赖项的 。 以下发行版具 阅读全文
posted @ 2021-08-09 13:59 Varden 编辑
摘要:参考:https://docs.projectcalico.org/getting-started/kubernetes/quickstart 使用此快速入门可以快速轻松地试用 Calico 功能。 准备 如果主机上存在 NetworkManager,确保 Calico 可以管理 cali和 tun 阅读全文
posted @ 2021-08-09 11:05 Varden 编辑
摘要:参考:https://docs.projectcalico.org/networking/determine-best-networking Calico 灵活的模块化架构支持广泛的部署选项,因此您可以选择适合您特定环境和需求的最佳网络方法。 这包括使用各种 CNI 和 IPAM 插件以及底层网络类 阅读全文
posted @ 2021-08-09 09:51 Varden 编辑
摘要:参考:https://kubernetes.io/zh/docs/tasks/network/customize-hosts-file-for-pods/ 当 DNS 配置以及其它选项不合理的时候,通过向 Pod 的 /etc/hosts 文件中添加条目, 可以在 Pod 级别覆盖对主机名的解析。你 阅读全文
posted @ 2021-08-07 22:12 Varden 编辑

点击右上角即可分享
微信分享提示