摘要:
背景 kubernetes: 1.16.3 master: 3台 采用kubeadm部署,在证书还有30天以上时,使用kubeadm alpha certs renew all更新所有证书,以为万无一失,但是到原有的证书过期时间,发现API异常告警。 问题 api-server日志: E0721 0 阅读全文
摘要:
ES数据写入过程: 数据写入请求——> 协调节点接收后数据路由处理——> 存入对应数据节点的 index buffer 并记录 translog 日志——> 经过 refresh 刷新为 segment 存入文件缓存并变为可搜索——> 数据永久刷新到磁盘并清空 translog 日志 在了解了数据写 阅读全文
摘要:
背景 最近公司网站经常被漏洞扫描,虽然并没有什么漏洞给对方利用,但是每次扫描我们也必须要察觉到,如果扫描的量太大,可以考虑从公有云的安全组上禁用掉这个IP,所以需要统计指定时间内每个IP的访问次数,这是一个手动的过程,非常麻烦。 ElasticAlert目前已经放弃维护了,如果不是依赖很重,建议直接 阅读全文
摘要:
背景 kubernetes: 1.16.3 CNI: flannel 因为Node有公网和内网两个IP,使用防火墙对机器进行安全加固 问题 开启防火墙后,不同节点的Node之间无法通信 # Generated by iptables-save v1.4.21 on Thu Jul 8 10:16:1 阅读全文
摘要:
Usage: 使用sidecar模式,跟业务进程运行在同一个Pod内,检测到configMap更新后,会自动触发Hook - name: prometheus-server-configmap-reload image: 'jimmidyson/configmap-reload:v0.3.0' ar 阅读全文
摘要:
官网配置详解 1.从官网下载最新版本的calico部署文件 # 下载的etcd版本 curl https://docs.projectcalico.org/manifests/calico-etcd.yaml -o calico.yaml 2.配置外置etcd,这里使用的和master同一个etcd 阅读全文
摘要:
非原创,参考文章如下,相对下列文章信息,操作和说明更加贴近日常工作: https://mp.weixin.qq.com/s/8A8YDAQd67YACnbZiN6Q5g https://felipecruz.es/visualizing-kubernetes-events-with-kspan/ 背 阅读全文
摘要:
1.磁盘使用率达到85时,触发imageGCManager 现象: node event: (combined from similar events): failed to garbage collect required amount of images. Wanted to free 5001 阅读全文
摘要:
故障现象 当将deployment的replicas调整到高于hpa的minreplicas时,这个时候,hpa无法缩容,并且无论修改replicas或minreplica,hpa都会将pod调整为你设置过deployment的replicais的最大值。 controller log I0525 阅读全文
摘要:
简介部分,有大量偷懒,借鉴 一.简介 Velero是一个开源工具,可以安全地备份,恢复和迁移Kubernetes集群和持久卷。它既可以在本地运行,也可以在公共云中运行。Velero由在Kubernetes集群中作为部署运行的服务器进程和命令行界面(CLI)组成,DevOps团队和平台操作员可使用该命 阅读全文