摘要:
前言 很多公司都在使用prometheus作为监控,并使用alertmanager发送告警消息,然而有的公司内部通讯软件使用的是企业微信,或者是飞书,或者是钉钉,那么如何让监控告警消息发送到这些通讯软件呢。 本文主要通过讲解自己开发的工具alertmanager-webhook来实现该功能,该工具已 阅读全文
摘要:
相信很多公司都在使用云服务器,不知道大家有没有注意到,当你购买了一台云服务器以后,在操作系统里面通过 free 命令查看服务器的内存,容量总是会小于在云厂商控制台上面看到的内存容量。 为什么会这样呢,那就带着疑问往下看。 现象描述 购买了2台云服务,控制台上面显示的内存是4GiB(4096MiB) 阅读全文
摘要:
由《羊了个羊》为话题切入点,结合自己的面试经历,详细讲解了高并发架构设计的演进过程!涉及到应用服务、数据库服务、缓存服务、负载均衡、ddos高防、WAF应用防火墙等多个知识点。 阅读全文
摘要:
前言 我们使用的各种软件,运行都离不开操作系统。大家都知道操作系统主要有Windows和Linux,如何查看当前操作系统的具体版本,你知道哪些方式呢? 1. Windows Windows系统大家都很熟悉,可以用图形界面直接查看。除了用鼠标点点点的方式,也可以用命令行查看。打开cmd窗口,执行: 方 阅读全文
摘要:
本周遇到了一个很奇葩的问题,客户的一台服务器无论如何都无法登录到机器系统里面去。可以肯定的是输入的登录密码是完全正确的,但是输入密码后,总在login登录界面无限循环。 今天抽空总结下这个问题的前因后果。 登录异常现象 1、ssh登录成功后,会立即退出。 输入错误密码正常报错 输入正确密码立即退出 阅读全文
摘要:
前言 Promethues是目前一个比较流行的开源监控项目,被使用也越来越多。我们都知道Prometheus是通过时序数据库来保存数据的,那么Prometheus采集到数据后,是如何保存在自已的时序数据库中的呢?通常我们看到Prometheus的数据指标都类似这样:node_cpu_seconds_ 阅读全文
摘要:
前言 prometheus是现在一个比较主流的监控软件,随着容器的普及,prometheus的应用越来越广泛,前面我也有专门讲到prometheus的相关文章。但是跟传统老牌的zabbix监控不一样,prometheus的web UI是没有登录认证的,有时候显得没有安全性,本文就主要讲解一下如何为p 阅读全文
摘要:
最近在对接对象存储,为了确保上传到对象存储的文件没有被损坏,所以需要计算文件的md5值,以确保文件的完整性。 现分享下目前工作中用到的各语言的md5的计算方式: linux shell md5sum ./cheshi.txt windows cmd certutil.exe -hashfile .\ 阅读全文
摘要:
国庆节之前,生产服务器上面的一些文件被异常删除,费了九牛二虎之力才找到删除原因,今天终于抽空在这里总结记录下事情的前因后果。 文件异常删除 9月27日突然接到 leader 的反馈,说业务团队没有收到当天的业务收据,让我检查对应的服务程序是不是异常。 于是开始登录对应服务器,开始检查每日数据发送的脚 阅读全文
摘要:
1. 前言 深度学习、图像渲染、科学计算、挖矿这些复杂计算的场景都需要使用GPU进行大量计算,但是当你拿到一台GPU服务器以后,你应该如何入手学习呢,如何进行调试呢。本文主要讲解一些GPU相关的知识,从GPU简单介绍开始,进而到linux下如何查看GPU相关指标,最后讲解如何调试调用GPU,并使用G 阅读全文