hhdb数据库介绍(10-21)
监控
监控面板
集群资源监控
服务器性能
在“配置->服务器”页面配置了服务器SSH信息且开启监控的情况下,在此监控面板中可监控到服务器的资源详细信息;当“服务器”页面停止”或者“移除”SSH配置后,此监控页面去除该服务器的监控图表。监控信息分页显示,默认每页显示5条记录,当服务器数量超过5台时,可手动选择每页显示10条记录、20条记录等此次类推。
页面信息说明
-
当在“配置->服务器”页面有未配置SSH信息的服务器记录时,监控页面会有提醒,并且可以点击超链接到“服务器”配置页面开启服务器监控
-
监控状态面板含所有纳入监控的服务器的详细监控信息,包括:CPU使用率、CPU负载、内存、磁盘读写速率(可切换监控的磁盘,监控面板设置页面可以设置监控磁盘的优先级)、磁盘使用情况(可切换监控的盘符,监控面板设置页面可以设置监控盘符的优先级)、网络进出流量(可切换监控的网卡,监控面板设置页面可以设置监控网卡的优先级)、tcp重传率
-
页面默认置顶显示故障、预警的记录,且优先级故障大于异常
-
通过“服务器”筛选下拉框的模糊搜索框,可多选服务器;也可以通过状态筛选服务器,筛选项有:“正常、预警、故障”
-
点击“状态框”可进入详情页面,如上图所示
-
点击监控模块右上角【放大】按钮可放大查看监控数据
网络质量
管理平台可对集群运行链路中的网络质量进行监控,根据检测数据分别展示运行网络质量、复制网络、跨机房网络等。
网络质量拓扑
(一)页面信息说明
手动触发网络质量检测,会获取此次执行网络质量的检测数据。当勾选【定时刷新】会定时(10s/次)检测网络质量数据并展示,且最新检测时间同步更新
筛选服务器搜索框的多选下拉框。下拉框选项中为当前集群内的所有服务器(关联集群服务程序的服务器)。当前主计算节点的服务器勾选框默认勾选且置灰不可编辑。如下图:
网络状态说明:
-
不限:最近一次检测的数据结果
-
正常:最近一次检测的数据未超过阈值
-
最新检测异常:最近一次检测的数据超过阈值、无法ping通或者丢包率100%
-
24小时内异常:从当前时间往前推24小时,有出现过数据超过阈值、无法ping通或者丢包率100%
拓扑图说明:
-
网络质量监控为当前主计算节点服务器向外ping所有集群的服务器
-
若出现集群服务程序共用的情况,则按照以下优先级划分该服务器属性:主计算节点>备计算节点>LVS>配置库>存储节点
-
数据超过阈值(连接线橙色)、无法ping通或者丢包率100%(连接线红色)
-
右键每台服务器可以查看服务器详情,点击跳转至“监控->物理智能拓扑”,可查看对应服务器的资源情况
网络质量概览
默认首次进入网络质量页面时,概览展示服务器网络质量状况优先级分别是:故障>预警>正常,且无论是手动刷新检测、切换拓扑图上的状态筛选标签、筛选服务器等操作,概览面板上的数据都不会自动刷新,除非点击对应的服务器,才会展示主计算节点到该服务器的网络质量情况。
概览说明:
-
IP:前面为主计算节点IP,后面为被ping集群服务器IP,该IP有正常(绿色)、异常(橙色/红色)两种状态。异常判定条件:最近一次检测数据超过阈值(橙色)、无法ping通达或者丢包率100%(红色)
-
网络质量数据为最近一次检测数据与24小时内的数据统计,分为ping小包与ping大包两类。最近一次检测数据显示最大延迟、平均延迟、丢包率。若丢包率为100%即全丢包,max、avg为“-”显示;最大延迟、平均延迟、丢包率任意一值超过管理平台设置阈值则红色显示。24小时内的数据统计显示最大延迟>2ms、平均延迟>1ms、丢包率>0%在24小时内超过阈值的次数。
-
若最新一次检测网络质量时出现异常,则点击异常的服务器,可自动带出最新一次检测异常的时间,显示在监控质量概览页面,颜色呈“橙色”;若最近一次检测网络质量时为正常状态,也会带出该次检测时间,颜色呈“蓝色”。
网络质量面板
网络质量面板显示对应的网络质量检测数据,默认展示当前24小时内的数据,不满24小时会隐藏拖动块,左右拖动可控制展示7天内的数据,鼠标移入折线图内可查看具体时间点的数据展示。点击左上角单选按钮,可切换ping包类型的数据展示,默认选择“ping小包”,点击“丢包率”、“平均延迟”、“最大延迟”进行隐藏或显示。该监控面板的数据采集频率与计算节点server.xml参数pingPeriod参数控制的采集频率一致,同时在网络质量故障的场景下,采集频率会自动提升为1分钟一次(网络质量故障的标准可参考pingPeriod相关参数功能描述)。
注意
网络质量监控显示的阈值数据,需根据监控面板设置->集群资源监控->网络质量进行设置,该开关默认关闭,关闭的情况下不进行数据阈值预警展示,若开关开启,页面展示依据阈值设置中的具体值进行显示以及判断,如下图:
跨机房网络质量
跨机房网络质量概览、网络质量面板与单机房相同,不再赘述。
跨机房网络质量拓扑与单机房网络质量拓扑有区别。
页面说明:
-
中心机房主计算节点服务器需要ping中心机房除自身外的所有服务器以及容灾机房的所有服务器,所以中心机房的主计算节点服务器分别放置在上图拓扑图区域的中心机房与容灾机房内(如上图标记1);
-
跨机房网络质量拓扑图只显示:中心机房计算节点服务器(包括主备计算节点)、容灾机房计算节点服务器(包括主备计算节点)中心机房配置库服务器、中心机房存储节点服务器、容灾机房配置库服务器、容灾机房存储节点服务器;
-
如果出现服务程序共用服务器时,按照单机房网络中描述的优先级划分服务器角色;
-
跨机房间的网络复制关系需根据中心机房与容灾机房存储节点主备搭建的复制关系进行网络质量链路连接(如上图标记2);
-
中心机房当前主存储节点/配置库到容灾机房的目标备存储节点/配置库之间的网络质量情况,需配置SSH权限之后才能获取监控数据,页面提示如下;
机房切换说明:
如果发生机房切换,即当前容灾机房的计算节点提供服务,则仅展示容灾机房的网络质量监控状态中心机房所有组件均置灰显示不做任何监控。且不存在容灾机房到中心机房的网络连线,同时容灾机房的网络连线关系退化成单机房一致。
网络质量邮件提醒
事件->通知策略->添加通知策略中新增网络质量监控项,在邮件设置中开启集群资源监控,设置监控项的通知频率,网络质量超过设置的阈值,将会发出异常邮件。
网络质量信息收集
工具->信息收集功能增加网络质量检测数据。
检测的数据追加到对应服务器中的“服务器相关信息.txt”文件中,如下图:
存储节点监控
存储节点监控页面依次展示各个存储节点实例的buffer命中率,并将各实例的命中率汇总展示总计的命中率。较高的buffer命中率意味着更快的数据访问速度及更高的系统性能。
页面信息说明
- 存储节点监控页面展示近30分钟内各实例及实例总计的buffer命中率;
- 可通过左上角的下拉选框,依据实例以及实例状态进行监控项的筛选。
监控设置 在“设置->监控面板设置”页面中找到【存储节点监控】项,可以设置告警阈值。当命中率低于阈值时,监控面板显示异常黄色告警,并且发送告警通知。
Note:
buffer命中率开关的开启与关闭只影响告警通知,不影响监控数据的更新
在“事件->通知策略”中存储节点信息监控勾选buffer命中率控制是否发送该项通知。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
2021-12-03 如何使用模板生成大量的sql语句