hhdb数据库介绍(10-18)

监控

智能逻辑拓扑

管理平台通过可视化方式将集群中前端应用、逻辑库、计算节点、数据节点、存储节点等物理与逻辑上的组件完整展示。并通过前端应用连接池与后端数据库连接池信息动态生成组件上的QPS与连接数信息。通过智能逻辑拓扑用户可以快速了解整个集群的运行状态,帮助用户实现高效运维。

容灾模式说明:集群开启容灾模式时,智能逻辑拓扑图相关逻辑说明请结合跨机房容灾部署文档中的智能逻辑拓扑章节

拓扑图组件说明

在这里插入图片描述
拓扑图由六层组件组成,按从上到下的位置分别为:前端应用、逻辑库、LVS、计算节点、数据节点、存储节点。

(一)前端应用

前端应用,即连接计算节点的客户端,应用程序通过IP、端口、用户密码连接(连接方式与连接MySQL一致)至指定逻辑库,即可在拓扑图中看到相关连接信息。前端应用的实时连接数、QPS若超出设置阈值,拓扑图会以橙色向上箭头显示告警信息。

(二)逻辑库

  • 逻辑库层在物理上属于虚拟的一层,逻辑库是HHDB Server产品虚拟出来的概念。通过拓扑图可查看整个集群中存在的所有逻辑库

  • 逻辑库图标上展示与之相关的“连接数”、“QPS”

  • “连接数”为连接当前逻辑库的所有前端应用连接数的总和

  • “QPS”为连接逻辑库的所有前端应用QPS的总和(逻辑库QPS偶尔会因数据获取时间的差等原因与总和数存在个位数偏差)

  • 当“QPS”与“连接数”超出设置阈值时,页面会通过橙色箭头显示告警

  • 当逻辑库下存在使用的数据节点中最后一个存储节点不可用时,该逻辑库图标会被标为黄色;表示该逻辑库存在部分数据暂时无法提供服务

(三)计算节点

  • 计算节点为整个集群的核心组件,提供数据查询等服务

  • 在拓扑图中会根据集群模式显示对应数量的计算节点图标,单节点模式显示一个,主备模式显示两个,多节点模式以配置计算节点的个数为准

  • 默认绿色代表当前主计算节点,蓝色代表当前备计算节点。出现红色则代表该计算节点存在异常无法连接,出现橙色则代表计算节点状态参数超过设定阈值

  • 多节点模式的集群会在当前主计算节点上标记“皇冠”代表当前集群的主

  • 鼠标悬停在计算节点图标时,显示后端连接数总数、直接内存使用率、前端连接数总数、堆内存使用率、后端进流量速率、后端出流量速率、前端进流量速率、端出流量速率、QPS、前端长事务数、后端长事务数、hold状态,当数据超过告警阈值时,会变橙色并加向上的箭头标记,当出现流量控制时,会出现黄色告警文字提醒

  • 开启只读模式的计算节点旁有(只读)标记

  • 计算节点会有VIP的图标显示,此图标会根据实际虚拟IP所在的计算节点进行变动,和主备角色无关。

  • 右击存储节点图标,则给出复制链接信息:

    • 主备模式的集群,主节点有此交互效果,备节点无此交互效果。

    • 主备模式集群的计算节点复制信息内的ip地址为vip信息。

    • 多节点集群的计算节点复制信息内的ip地址为计算节点所在服务器的ip信息。

(四)LVS

  • 计算节点集群模式可通过LVS实现高可用和负载均衡。

  • 默认绿色代表LVS状态正常,蓝色代表当前备LVS。出现红色则代表该LVS存在异常。

  • 主LVS会有VIP的图标显示,此图标会根据实际虚拟IP所在的LVS进行变动。

  • 移入主LVS图标时,显示转发主机列表、权重值、连接数的信息。

  • 右键主LVS图标时,则给出vip复制链接信息。

(五)数据节点

  • 数据节点是HHDB Server虚拟出来的概念,在物理层面实际上并不存在

  • 数据节点可以将一组具备复制关系的存储节点放到一起进行管理,方便查看和后期运维

  • 数据节点信息“复制状态”:在双主、主从存储节点显示的复制状态参数。复制状态包括:正常、异常、未知。复制状态与节点管理页面中的“主从状态”保持一致

  • 若数据节点下最后一个可用的存储节点运行异常,该数据节点图标会被标黄显示。表示该数据节点下的数据暂时无法提供服务。

  • 当复制状态为未知时,备存储节点用黄色显示且闪烁,鼠标移入显示未知原因信息。未知原因与节点管理中主从状态未知提示的原因保持一致,未知分四种情况:存储节点无法连接,存储节点权限不足、检测超时(超时时间1分钟)、当前节点非主从复制关系。除上述情况外,针对双主带从的情况,如果配置了master_id而主从关系匹配不上,也是“未知”状态,提示:“当前节点主从关系与配置不一致”

  • 数据节点信息“数据容量”:数据容量以数据节点下的当前主库数据容量为准。即当前主库数据量 = 数据节点显示的数据容量。(数据量单位用K、M、G表示)

  • 数据节点信息“故障切换时间”:为备库正式接管服务的时间

  • 数据节点信息“故障切换耗时”:为从主库发生故障开始,备库等待追平然后连接切换至备库,到备库开始正常提供服务为故障切换耗时。只在切换成功时显示此参数;如果运行正常或者切换失败或者切换过程中,主库又重新恢复时,该参数不显示时间,只用“- -”代替显示。切换耗时的时间单位用:ms、s、min、h显示

  • 数据节点信息“主备数据一致”:当节点类型为双主、主备、一主多从类型时标识多个存储节点上的数据和对象是否一致,该值有“--,正常和异常”三种状态,对应状态根据菜单“检测->主备数据一致性检测”的最新检测结果进行展示。

  1. 当所选节点未进行主备数据一致性检测时:主备数据一致显示为“--”

在这里插入图片描述

  1. 当所选节点检测结果为“无法检测”或“不一致”时:主备数据一致显示“异常”且为橙色超链接,点击超链接跳转至主备一致性检测结果详情页

在这里插入图片描述

  1. 当所选节点检测结果为“一致”时:主备数据一致显示为“正常”

在这里插入图片描述

  1. 当所选节点检测结果为“一致”且有"存在无法检测的情况"时(即多个检测节点):主备数据一致根据实际的检测结果匹配,检测结果一致的节点显示为“正常”,无法检测的节点显示“异常”且为橙色超链接
  • 数据节点信息“连接数”:由数据节点下所有存储节点上的连接数相加获得

  • 数据节点信息 “QPS”: 由数据节点下所有存储节点上的QPS相加获得

(六)存储节点

  • 业务数据真实的存储层

  • 默认绿色带“M”字样的为当前主存储节点,蓝色带“S”字样的为备存储节点,双主备库为蓝色带“M”字样,带“MGR”字样的为MGR类型的存储节点

  • 存储节点名称是否显示,受到开关的配置限制。

  • 单击图标存储节点,将会置顶显示全称或缩写。右击存储节点图标,则给出复制链接信息。

  • 当计算节点开启了strategyForRWSplit读写分离策略(只要不是“不开启读写分离策略”的配置都算作开启了读写分离),则主存储节点会展示“W”标记,备存储节点展示“R”标记,如下图:

在这里插入图片描述
在这里插入图片描述

  1. 若计算节点开启了读写分离,但可读备存储节点的复制延迟时间超出maxLatencyForRWSplit配置的最大延迟时间,则主存储节点的“W”标记仍显示,备存储节点的“R”标记不显示。

在这里插入图片描述

  1. 若计算节点为只读计算节点实例,无论是否开启strategyForRWSplit读写分离策略,“W”,“R”标记都不显示。

在这里插入图片描述

  • 若图标为红色则代表存在故障,鼠标移入故障存储节点图标可显示故障原因,橙色代表存在复制延迟或数据节点下最后一个存储节点不可用

  • 存储节点会显示“复制延迟”(主从或双主关系的存储节点才会显示,延迟数据从show salve status中获取)、“连接数”(根据后端存储节点连接池动态生成)、“QPS”

  • 若当前的空闲连接数大于存储节点本身配置最大空闲连接数时,存储节点图标会显示空闲连接数的监控值,并以告警橙色展示

在这里插入图片描述
(七)配置库

  • 在存储层左侧始终显示集群中计算节点配置库组件

  • 为无状态图标,该图标连接一个或两个配置库,分别表示单节点配置库和双主配置库。在单机房模式下,若连接三个及以上的配置库,则代表MGR模式的配置库。当所有配置库不可用时, 会显示为橙色

  • 与存储节点类似,配置库图标为红色代表存在故障,鼠标移入红色图标可显示故障原因;橙色代表存在复制状态异常,鼠标移入橙色图标可显示复制异常原因

  • 配置库上显示“复制时延”的监控信息。与存储节点类似,复制时延可以在“设置 —> 拓扑图告警设置”中的配置库模块下设置复制时延的告警阈值

其他说明

  • 关于组件更详细介绍请参照名词解释功能使用手册

  • 拓扑图中组件显示的参数告警信息阈值可在“设置->[拓扑图告警设置]”中配置

  • 数据节点图标右键可直接进行主备切换,切换逻辑同“节点管理->主备切换”(单库或MGR类型的数据节点无该操作入口)

  • 存储节点图标右键可快速复制存储节点连接命令行,复制内容如:mysql -uhotdb_datasource -p -P3306 -h192.168.220.232 -Ddb05。(因安全问题连接密码不给出)

界面调整功能

在这里插入图片描述

  1. 视觉切换
  • 可通过界面【2.5D】按钮将拓扑图视觉效果切换到“2.5D”,点击【2D】可切回普通视觉效果。
  1. 拓扑图设置
  • 可选择隐藏或展示各组件显示的“QPS”、“连接”信息。

  • 若拓扑图页面逻辑库太多,可通过设置中的逻辑库筛选进行针对性的查看。

  • 因在拓扑图“普通视图”中各组件可拖动,为了将拖乱的组件重新归位可点击【重置组件排列】将各组件位置复原。

  1. 拓扑图信息面板
  • 鼠标移入【<】按钮中可唤出拓扑图信息面板,信息面板主要记录拓扑图中INFO(页面组件的加入或退出)、WARNING(各组件告警参数超出阈值的信息)、ERROR(组件发生异常时的信息)等信息。

  • 拓扑图信息面板记录的信息无法被手动删除,但可以在信息面板右上角的【设置】按钮中设置记录信息的窗口期(本地保留时间),同时为了减少WARNING级别的信息,可设置告警次数连续达到三次才记录信息。

2.5D拓扑图

2.5D拓扑图是在原有基础拓扑图上进行视觉升级的功能。该功能显示的组件与组件信息与上述“普通视觉”拓扑图一致,功能也大致相似。

在这里插入图片描述
2.5D拓扑图特殊说明:

  • 2.5D拓扑不支持任意部件拖动,所有部件位置固定。

  • 计算节点发生故障后,故障的计算节点显示在主计算节点的右边。

  • 页面所有应用服务器、逻辑库、计算节点、数据节点、存储节点的显示状态,均与单机房模式一致。

  • 右上角切换、设置、信息弹出面板功能和单机房模式保持一致。

  • 支持通过鼠标滚动方式或页面放大缩小按钮对视图实现放缩,支持页面拖动。

posted @   恒辉信达  阅读(12)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
点击右上角即可分享
微信分享提示