代码改变世界

随笔档案-2019年07月

【prometheus 抓取源】

2019-07-27 16:01 by ZealouSnesS, 691 阅读, 收藏, 编辑
摘要: 配置prometheus从prometheus爬取数据 prometheus提供了下面这个端口来让其他prometheus来抓取(scrape)自己的时序数据: 可视化查看目前的prometheus都有哪些抓取源 浏览器访问: 阅读全文

【PromQL】prometheus查询语言

2019-07-26 15:17 by ZealouSnesS, 3849 阅读, 收藏, 编辑
摘要: 常用查询: https://songjiayang.gitbooks.io/prometheus/content/exporter/nodeexporter_query.html group by 操作 或 例如 CPU 使用率 CPU 各 mode 占比率 rate和irate操作符:计算Coun 阅读全文

【grafana报错】Singlestat "Error: Multiple Series Error"

2019-07-26 15:02 by ZealouSnesS, 1676 阅读, 收藏, 编辑
摘要: 这个错误是因为grafana中的单值面板在同一个时刻读到了多个值。需要检查面板的json源码,检查其expr字段中的promql表达式是否会在同一时刻返回多个值。 https://github.com/grafana/grafana/issues/3107 阅读全文

【prometheus抓取间隔】scrape_interval

2019-07-18 19:44 by ZealouSnesS, 8065 阅读, 收藏, 编辑
摘要: prometheus如何设置比较合理: https://www.robustperception.io/keep-it-simple-scrape_interval-id 总结:一般设置在10s-60s之间 如何修改抓取间隔? 在项目里全局搜索interval这个词,所有有爬取间隔的配置位置就可以搜 阅读全文

【分布式一致性】etcd

2019-07-18 19:39 by ZealouSnesS, 437 阅读, 收藏, 编辑
摘要: etcd: https://jimmysong.io/kubernetes-handbook/concepts/etcd.html 什么是 分布式一致性: http://thesecretlivesofdata.com/raft/ 阅读全文

【kubectl 原理】kubectl 命令执行的时候究竟发生了什么(kubectl、apiserver、etcd)

2019-07-15 17:39 by ZealouSnesS, 864 阅读, 收藏, 编辑
摘要: 参考: https://www.yangcs.net/posts/what-happens-when-k8s/ 总而言之,kubectl命令执行的时候,先在本地封装请求,然后过kube-apiserver验证控制,然后到etcd读or写数据。 apiserver的启动与部署: http://hard 阅读全文

【kubernetes 自带监控】 container级别cadvisor+kubelet,集群级别apiserver

2019-07-12 10:03 by ZealouSnesS, 4403 阅读, 收藏, 编辑
摘要: apiserver https://feisky.gitbooks.io/kubernetes/components/apiserver.html kube-apiserver 支持同时提供 https(默认监听在 6443 端口)和 http API(默认监听在 127.0.0.1 的 8080 阅读全文

单机prometheus vs 集群kube-prometheus+prometheus-operator

2019-07-12 10:02 by ZealouSnesS, 802 阅读, 收藏, 编辑
摘要: prometheus 组件: node-exporter:9100端口 https://segmentfault.com/a/1190000017959127 阅读全文

【tshark tcpdump】linux网络排查

2019-07-11 10:05 by ZealouSnesS, 480 阅读, 收藏, 编辑
摘要: 抓包: 1、tcpdump 2、tshark是wireshark的命令行版。 tshark使用示例: 3、查看网络流量 iftop iftop,查看哪个进程占用带宽 阅读全文

DNS解析问题

2019-07-07 17:46 by ZealouSnesS, 357 阅读, 收藏, 编辑
摘要: DNS解析问题,在/etc/resolv.conf文件中加如下一行: 即使用谷歌的域名服务器 如下问题都是DNS解析问题: 阅读全文

【helm & Tiller】报错Error: incompatible versions client[v2.14.1] server[v2.13.0] │

2019-07-05 14:41 by ZealouSnesS, 2774 阅读, 收藏, 编辑
摘要: helm是helm的客户端部分 tiller是helm的服务器端部分 报错 报错Error: incompatible versions client[v2.14.1] server[v2.13.0] 的解决办法: 将客户端的helm降级到2.13.0或者将服务器端的helm升级到2.14.0,一般 阅读全文

【shell比较字符串】

2019-07-02 19:47 by ZealouSnesS, 356 阅读, 收藏, 编辑
摘要: shell比较字符串只能用=,不能用eq! 注意,加黄底色部分空格必不可少! 阅读全文

【k8s 硬盘监控】prometheus grafana

2019-07-02 19:40 by ZealouSnesS, 611 阅读, 收藏, 编辑
摘要: 设置监控哪块盘: https://www.bountysource.com/issues/50160777-disk-space-usage-depcited-in-grafana-correct https://www.google.com.hk/search?q=(sum(node_filesy 阅读全文

【k8s node断电重启】

2019-07-02 15:43 by ZealouSnesS, 1391 阅读, 收藏, 编辑
摘要: kubernetes断电重启 导致部分pod无法删除 dashboard上处于黄色 kubectl get处于terminate 状态 kubectl delete报错: kubectl get nodes发现node失联: 但是发现能ssh到失联的node上去,于是重启kubelet 发现没用。于 阅读全文

【k8s label】对node添加删除label,并根据label筛选节点

2019-07-02 14:23 by ZealouSnesS, 15571 阅读, 收藏, 编辑
摘要: 添加 kubectl label nodes kube-node label_name=label_value kubectl label nodes 1.1.1.1 label_name=label_value kubectl label nodes kube-node label_name=la 阅读全文

【docker 镜像源】解决quay.io和gcr.io国内无法访问的问题

2019-07-01 21:35 by ZealouSnesS, 5814 阅读, 收藏, 编辑
摘要: 该问题容易导致image pull back off 错误,应当换源: 微软: https://yeasy.gitbooks.io/docker_practice/install/mirror.html 阿里 七牛: https://blog.csdn.net/zsd498537806/articl 阅读全文
点击右上角即可分享
微信分享提示