摘要: 通常我们采集Redis的性能数据时,或者想要知道Redis当前的性能如何时,需要知道这个实例的QPS数据,那么这个QPS数据是如何计算的呢?我们都有哪些办法或者这个QPS ? QPS顾名思义就是每秒执行的指令数,猜想Redis里边肯定是有个计数器来对每次执行的命令进行一次累计操作,通过这个思路不难想 阅读全文
posted @ 2024-07-01 14:39 fengjian1585 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 方法一命令如下: find src_dir -name "access.log.2011102[2-6]*" -exec cp {} dst_dir \; 拷贝文件到远程主机上的目标目录的命令: find src_dir -name "access.log.2011102[2-6]*" -exec 阅读全文
posted @ 2024-06-19 17:02 fengjian1585 阅读(1) 评论(0) 推荐(0) 编辑
摘要: https://github.com/google/go-containerregistry/releases/download/v0.19.1/go-containerregistry_Linux_x86_64.tar.gz crane auth 登录或访问凭证 crane delete 从其注册 阅读全文
posted @ 2024-06-13 09:44 fengjian1585 阅读(4) 评论(0) 推荐(0) 编辑
摘要: Kubernetes从1.9版本开始引入容器存储接口 Container Storage Interface (CSI)机制,用于在Kubernetes和外部存储系统之间建立一套标准的存储管理接口,通过该接口为容器提供存储服务。 CSI的核心组件和部署架构 Kubernetes CSI存储插件的关键 阅读全文
posted @ 2024-06-12 17:21 fengjian1585 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 大概的配置参数: node故障后,pod会迁移到 正常的node上, 迁移时间大概8分钟左右, 如果是微服务,注册到nacos,服务不受影响,但是对于其他的服务,请求中会有大量失败。 需要几个流程: kubelet 自身会定期更新状态到 apiserver,通过kubelet的参数 node-sta 阅读全文
posted @ 2024-06-07 15:23 fengjian1585 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 在Harbor服务主机上,可通过如下命令在 registry 存储目录下获取镜像列表: $ grep data_volume /app/harbor/harbor.yml #根据配置文件查找数据存储目录 data_volume: /data $ cd /data/registry #进入到Harbo 阅读全文
posted @ 2024-05-22 09:29 fengjian1585 阅读(111) 评论(0) 推荐(0) 编辑
摘要: Linux环境下安装完mongodb,运行./mongod报错如下 # ./mongod./mongod: /lib64/libc.so.6: version `GLIBC_2.14' not found (required by ./mongod) 使用rpm -qa |grep glibc查看系 阅读全文
posted @ 2024-04-18 09:48 fengjian1585 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 前言: mysqldump 是日常比较常用的一个工具了,在对数据库进行导出工作时,经常会用到 mysqldump 。本篇文章将介绍 mysqldump 工具的使用方法并分享几点备份技巧。 1.mysqldump使用简介 mysqldump 是 MySQL 系统自带的逻辑备份工具,主要用于转储数据库。 阅读全文
posted @ 2024-02-18 16:24 fengjian1585 阅读(12) 评论(0) 推荐(0) 编辑
摘要: ./config --prefix=/usr/local/openssl --openssldir=/usr/local/openssl make && make install ./config -d shared --prefix=/usr/local/openssl --openssldir= 阅读全文
posted @ 2024-02-01 10:15 fengjian1585 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 判断是否开启超线程 逻辑CPU个数: grep -c processor /proc/cpuinfo 物理CPU个数: grep 'physical id' /proc/cpuinfo |sort -u|wc -l “siblings”指的是一个物理CPU有几个逻辑CPU grep 'sibling 阅读全文
posted @ 2024-01-31 11:46 fengjian1585 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 用 ansible 设置用户的密码时,由于需要对传输的密码进行加密, #!/usr/bin/python3 import crypt import sys # 接收要加密的密码 password = sys.argv[1] # 生成salt salt = crypt.mksalt(crypt.MET 阅读全文
posted @ 2023-12-21 08:54 fengjian1585 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 查看系统设置的连接数 ulimit -a 使用命令查看1、Linux系统下,所有进程允许打开的最大fd数量。查询语句:cat /proc/sys/fs/file-max2、Linux系统下,所有进程已经打开的fd数量及允许的最大数量。查询语句:cat /proc/sys/fs/file-nr3、单个 阅读全文
posted @ 2023-11-14 15:29 fengjian1585 阅读(26) 评论(0) 推荐(0) 编辑
摘要: ansible node2 -m yum -a "name=unzip state=present" -e "ansible_python_interpreter=/usr/bin/python3" 阅读全文
posted @ 2023-11-01 16:58 fengjian1585 阅读(18) 评论(0) 推荐(0) 编辑
摘要: Redis 缓存使用内存来保存数据,随着需要缓存的数据量越来越大,有限的缓存空间不可避免地会被写满。此时,应该怎么办?本篇文章接下来就来聊聊缓存满了之后的数据淘汰机制。 值得注意的是,在 Redis 中 过期策略 和 内存淘汰策略 是两个完全不同的概念。Redis 过期策略指的是 Redis 使用哪 阅读全文
posted @ 2023-08-29 09:08 fengjian1585 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 通常情况下,我们的kubernetes集群是内网环境,如果希望通过本地访问这个集群,怎么办呢?大家想到的是Kubeadm在初始化的时候会为管理员生成一个 Kubeconfig文件,把它下载下来 是不是就可以?事实证明这样不行, 因为这个集群是内网集群,Kubeconfig文件 中APIServer的 阅读全文
posted @ 2023-08-24 13:20 fengjian1585 阅读(434) 评论(0) 推荐(0) 编辑
摘要: etcd 概述 etcd 是 CoreOS团队于2013年6月发起的开源项目,它的目标是构建一个高可用的分布式键值(key-value)数据库。 etcd 内部采用 raft 协议作为一致性算法,etcd基于Go语言实现。 完全复制:集群中的每个节点都可以使用完整的存档 高可用性:Etcd可用于避免 阅读全文
posted @ 2023-08-14 12:28 fengjian1585 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 问题描述 测试集群三台master,每个master上面的kube-apiserver都频繁的重启。登录其中一台master,发现kube-apiserver的内存占用特别高,每次重启完后内存很快就飙到了20G左右,而且还有继续增长的趋势。因为默认kube-apiserver的静态pod是没有设置m 阅读全文
posted @ 2023-07-26 16:24 fengjian1585 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 一 原理 Velero 的基本原理就是将Kubernetes 集群资源对象数据备份到对象存储中,并能从对象存储中拉取备份数据来恢复集群资源对象数据。不同于etcd 备份——将集群的全部资源备份起来——Velero 是对Kubernetes 集群内资源对象级别进行备份,可以通过对Type、Namesp 阅读全文
posted @ 2023-07-14 14:18 fengjian1585 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 一、 性能测试基础 1. 性能测试概述 性能测试分类 性能测试方式时通过模拟生产运行的业务压力量和使用场景组合,测试系统的性能是否满足生产性能要求,通俗地讲,这种方法就是要在特定的运行条件下验证系统的能力状况。 阅读全文
posted @ 2023-07-07 15:15 fengjian1585 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 一、QPS 每秒查询QPS:Queries Per Second意思是“每秒查询率”,是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。互联网中,作为域名系统服务器的机器的性能经常用每秒查询率来衡量。 二、TPS 每秒事务TPS:是Transactio 阅读全文
posted @ 2023-06-27 14:20 fengjian1585 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 使用crio容器运行时,部署ssh pod后,ssh root@127.0.0.1 后,出现 connection reset by 127.0.0.1 port 22. 但是telnet 显示能通, 在pod中 ping 其他pod 出现 socket: Operation not permitt 阅读全文
posted @ 2023-06-02 16:23 fengjian1585 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 本文最终的解决方式很简单,就是将现有卷升级为支持更高 IOPS 的卷,但解决问题的过程值得推荐。 我们的团队看管着大约 30 套自建的 Kubernetes 集群,最近需要针对 etcd 集群进行性能分析。 每个 etcd 集群有 5 个成员,实例型号为 m6i.xlarge,最大支持 6000 I 阅读全文
posted @ 2023-05-29 13:32 fengjian1585 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 由于master2 节点重新克隆了,造成etcd异常, 恢复过程 1. 从etcd集群中删除 master2 etcd # 登录集群的任意 ETCD Pod kubectl exec -it etcd-master sh -n kube-system # Pod 中设置登录 ETCD 的命令 exp 阅读全文
posted @ 2023-05-26 14:35 fengjian1585 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 报错信息 kubelet summary_sys_containers.go: "Failed to get system container stats stats": err="failed to get cgroup stats for “/system.slice/kubelet.servi 阅读全文
posted @ 2023-05-16 10:41 fengjian1585 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 配置Nginx-Ingress 这里将NG的日志落盘,便于处理。 (1)、修改ConfigMap,如下: # Source: ingress-nginx/templates/controller-configmap.yaml apiVersion: v1 kind: ConfigMap metada 阅读全文
posted @ 2023-03-29 13:06 fengjian1585 阅读(287) 评论(0) 推荐(0) 编辑
摘要: 内核参数调优 我们先看看通过内核的哪些参数能够提高Ingress的性能。保证在高并发环境下,发挥Ingress的最大性能。 调大全连接队列的大小 TCP 全连接队列的最大值取决于 somaxconn 和 backlog 之间的最小值,也就是 min(somaxconn, backlog)。在高并发环 阅读全文
posted @ 2023-03-29 13:04 fengjian1585 阅读(576) 评论(0) 推荐(0) 编辑
摘要: kustomize 是一个通过 kustomization 文件定制 kubernetes 对象的工具,它可以通过一些资源生成一些新的资源,也可以定制不同的资源的集合。 一个比较典型的场景是我们有一个应用,在不同的环境例如生产环境和测试环境,它的 yaml 配置绝大部分都是相同的,只有个别的字段不同 阅读全文
posted @ 2023-03-23 17:09 fengjian1585 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 安装 Metrics server Metrics Server 是 Kubernetes 内置自动缩放管道的可扩展、高效的容器资源指标来源。 Metrics Server 从 Kubelets 收集资源指标,并通过Metrics API在 Kubernetes apiserver 中公开它们,以供 阅读全文
posted @ 2023-03-03 09:55 fengjian1585 阅读(71) 评论(0) 推荐(0) 编辑
摘要: ingress 转发到一个pod时 ,请求全部为200, 增加到两个pod时,返回码出现302. 从ingress nginx pod上看, 没有rewrite 配置, 通过日志查看 确实302 问题。 基本上就是 session 或者cookie问题 通过配置 annotations 实现一个客户 阅读全文
posted @ 2023-02-10 15:02 fengjian1585 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 事件背景 因为 k8s 中采用大量的异步机制、以及多种对象关系设计上的解耦,当应用实例数 增加/删除、或者应用版本发生变化触发滚动升级时,系统并不能保证应用相关的 service、ingress 配置总是及时能完成刷新。在一些情况下,往往只是新的 Pod 完成自身初始化,系统尚未完成 Endpoin 阅读全文
posted @ 2023-01-31 13:28 fengjian1585 阅读(942) 评论(0) 推荐(0) 编辑
摘要: 1、TPS: Transactions Per Second,意思是每秒事务数。一个事务是指客户端向服务器发送请求然后服务器做出反应的过程,具体的事务定义,可以是一个接口、多个接口、一个业务流程等等。以单接口定义为事务举例,每个事务包括了如下3个过程: (1)向服务器发请求(2)服务器自己的内部处理 阅读全文
posted @ 2022-12-13 15:54 fengjian1585 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 集群指标 集群 CPU 利用率 目录 表达式 详细信息 1 - (avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance)) 摘要 1 - (avg(irate(node_cpu_seconds_total{mode="idl 阅读全文
posted @ 2022-12-09 15:24 fengjian1585 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 网络数据包截获分析工具。支持针对网络层、协议、主机、网络或端口的过滤。并提供and、or、not等逻辑语句帮助去除无用的信息。 不指定任何参数 监听第一块网卡上经过的数据包。主机上可能有不止一块网卡,所以经常需要指定网卡。 tcpdump 监听特定网卡 tcpdump -i en0 监听特定主机 例 阅读全文
posted @ 2022-12-06 09:50 fengjian1585 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 文件中某一行结尾有空格,示例中是最后一行(使用vim工具:set invlist) 阅读全文
posted @ 2022-11-28 13:02 fengjian1585 阅读(618) 评论(0) 推荐(0) 编辑
摘要: 采集器categraf集成了prometheus的agent mode模式,prometheus所支持服务发现模式,例如docker_swarm_ad_configs,docker_sd_config, dns_sd_configs, http_sd_configs都可以和categraf无缝对接。 阅读全文
posted @ 2022-11-22 17:30 fengjian1585 阅读(1343) 评论(0) 推荐(0) 编辑
摘要: 使用的 rancher出现 Internal error occurred: failed calling webhook "rancherauth.cattle.io": Post "https://rancher-webhook.cattle-system.svc:443/v1/webhook/ 阅读全文
posted @ 2022-11-15 09:26 fengjian1585 阅读(287) 评论(0) 推荐(0) 编辑
摘要: 简述: 最近k8s master内存压力比较大, pod数量越来越多, 打算对cpu 内存进行扩容 扩容有 cpu 4C/8G, 变更成8C/16G, 通过升级后,发现apiserver 静态pod无法启动, 在kubelet 配置文件中发现 --cpu-manager-policy=static配 阅读全文
posted @ 2022-11-03 09:09 fengjian1585 阅读(801) 评论(0) 推荐(0) 编辑
摘要: zookeeper授权方式设置 一、设置授权 1.1、IP白名单方式 备注:对需要进行白名单设置的路径进行设置,此处设置的路径没有继承关系,即设置了/test的白名单,但是/test/test2依然没有设置为白名单。 setAcl /test ip:127.0.0.1:cdrwa 权限组合字符串,由 阅读全文
posted @ 2022-10-10 13:34 fengjian1585 阅读(1019) 评论(0) 推荐(0) 编辑
摘要: Thanos[1] 和 VictoriaMetrics[2] 都是用来作为 Prometheus 长期存储的成熟方案,其中 VictoriaMetrics 也开源了其集群版本[3],功能更加强大。这两种解决方案都提供了以下功能: 长期存储,可以保留任意时间的监控数据。 对多个 Prometheus 阅读全文
posted @ 2022-10-08 10:27 fengjian1585 阅读(385) 评论(0) 推荐(0) 编辑
摘要: 描述 mod_cluster是jboss的一个开源集群模块(基于httpd 2.2.x,也就是httpd2的一个模块),主要功能包括:自动发现集群主机并注册主机;为集群提供负载均衡能力;为集群提供容灾的能力。mod_cluster 和mod_jk, mod_proxy类似,是一个基于httpd的负载 阅读全文
posted @ 2022-08-29 13:07 fengjian1585 阅读(522) 评论(0) 推荐(0) 编辑