随笔分类 - 云计算
摘要:
前言 很多公司都在使用prometheus作为监控,并使用alertmanager发送告警消息,然而有的公司内部通讯软件使用的是企业微信,或者是飞书,或者是钉钉,那么如何让监控告警消息发送到这些通讯软件呢。 本文主要通过讲解自己开发的工具alertmanager-webhook来实现该功能,该工具已
阅读全文

摘要:本周遇到了一个很奇葩的问题,客户的一台服务器无论如何都无法登录到机器系统里面去。可以肯定的是输入的登录密码是完全正确的,但是输入密码后,总在login登录界面无限循环。 今天抽空总结下这个问题的前因后果。 登录异常现象 1、ssh登录成功后,会立即退出。 输入错误密码正常报错 输入正确密码立即退出
阅读全文
摘要:前言 Promethues是目前一个比较流行的开源监控项目,被使用也越来越多。我们都知道Prometheus是通过时序数据库来保存数据的,那么Prometheus采集到数据后,是如何保存在自已的时序数据库中的呢?通常我们看到Prometheus的数据指标都类似这样:node_cpu_seconds_
阅读全文
摘要:最近在对接对象存储,为了确保上传到对象存储的文件没有被损坏,所以需要计算文件的md5值,以确保文件的完整性。 现分享下目前工作中用到的各语言的md5的计算方式: linux shell md5sum ./cheshi.txt windows cmd certutil.exe -hashfile .\
阅读全文
摘要:1. 前言 深度学习、图像渲染、科学计算、挖矿这些复杂计算的场景都需要使用GPU进行大量计算,但是当你拿到一台GPU服务器以后,你应该如何入手学习呢,如何进行调试呢。本文主要讲解一些GPU相关的知识,从GPU简单介绍开始,进而到linux下如何查看GPU相关指标,最后讲解如何调试调用GPU,并使用G
阅读全文