DNS域名轮询业务监控
一、概要
大部分的DNS解析都是一个域名对应一个IP地址,但是通过DNS轮循技术可以做到一个域名对应多个IP,从而实现最简单且高效的负载平衡,不过此方案最大的弊端是目标主机不可用时无法被自动剔除,因此做好业务主机的服务可用监控至关重要。本示例通过分析当前域名的解析IP,在结合服务端口探测来实现自动监控,在域名解析中添加、删除IP时,无须对监控脚本进行更改。
2、步骤
1)实现域名的解析,获取域名所有的A记录解析IP列表
2)对IP列表进行HTTP级别的探测
3、代码解析
python2 httplib官方文档:https://docs.python.org/2/library/httplib.html
python3 http.client官方文档:https://docs.python.org/3.4/library/http.client.html
通过dns.resolver.quer()方法获取业务域名A记录信息,查询出所有IP地址列表,再使用(在Python2中httplib模块,Python3中http.client模块)的request()方法以GET方式请求监控页面,监控业务所有服务的IP是否服务正常。
#!/usr/bin env python import dns.resolver import http.client iplist=[] #定义域名IP列表变量 appdomain="baidu.com" #定义业务域名 def get_iplist(domain=""): #域名解析函数,解析成功IP将被迫追加到iplist try: A = dns.resolver.query(domain,'A') #解析A记录类型 except Exception as e: print("dns resolver error:"+str(e)) return None for i in A.response.answer: for j in i.items: iplist.append(j.address) #追加到iplist return True def checkip(ip): checkurl=ip + ":80" getcontent="" code=None conn=http.client.HTTPConnection(checkurl,timeout=5) #创建http连接对象,定义http连接超时时间(5秒) try: conn.request("GET","/",headers={"Host": appdomain}) #发起URL请求,添加http连接对象 r=conn.getresponse() getcontent=r.read(15) #获取URL页面前15的字符,以便做可用性校验 code=r.code #获取状态码 finally: if getcontent=="<!DOCTYPE HTML>": #获取URL页面的内容一般是事先定义好的,比如"HTTP2000"等 print(ip + " [OK]") elif code in [200,301,302]: #正常状态码 print(ip + " [OK]") else: print(ip + " [Error]") #此处可放告警程序,可以是邮件、短信通知 if __name__ == '__main__': if get_iplist(appdomain) and len(iplist) > 0: #条件:域名解析正确至少返回一个IP for ip in iplist: checkip(ip) else: print('dns resolver error.')
可以将此脚本放到crontab中定时运行,在结合告警程序,这样一个基于域名轮循的业务监控已完成。运行程序,显示结果如下:
[root@localhost dns_python]# python simple5.py 220.181.57.216 [OK] 123.125.115.110 [OK]
从结果可以看出,域名baidu.com解析出3个IP地址,并且服务都是正常的。