华为超聚变2288H V5 服务器安装Windows系统后 PCI数据捕获和信号处理控制器 出现感叹号

2288H v5服务器安装Windows系统后,PCI数据捕获和信号处理控制器 出现感叹号

 

 

解决方案:

1、可以在IBMC界面的“诊断-黑匣子” 关闭黑匣子功能,然后重启设备

 

 2、可以在操作系统侧安装IBMA软件

软件下载链接:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/software

安装手册:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/document

 

上述任意操作后问题解决:

 

注意:iBMA安装时需要完全解压,不能在压缩包内执行,否则出现“版本10.0.x.xxx不支持”。

 

   iBMA可以支持服务器CPU、内存、硬盘、网卡、IB卡、PCIe、RAID卡、光模块等各个组件的状态监控、性能监控、事件监控。

   iBMA同时提供了黑匣子功能,开启黑匣子功能后,能记录系统发生异常宕机时的状态信息和调试信息,可以辅助异常定位。iBMA提供了事件上报功能,iBMA周期性检测物理盘、逻辑盘、RAID控制器等状态变化事件,有事件变化情况下通过Redfish事件订阅接口上报事件信息到上层管理软件。

   用户在系统上安装iBMA软件后,iBMA提供的主要功能如表示。

功能

介绍

系统信息获取

将操作系统、网卡、IB卡、硬盘、RAID卡等信息提供给iBMC。

文件上传

支持esight和其它工具通过iBMC的Redfish接口将文件上传至iBMA运行的服务器,详细请参考服务器 iBMC Redfish 接口说明

驱动升级

支持eSight和其他工具通过iBMC的Redfish接口进行驱动升级,详细请参考服务器 iBMC Redfish 接口说明

说明

l  进行驱动升级前需中断业务。

l  升级过程中不允许对系统进行下电、复位等操作。

系统状态监控

定时监控系统信息和健康状态的变化情况,用于上报给iBMC进行告警。

软件管理

支持FusionDirector和其他工具通过iBMC的Redfish接口进行软件的查询、安装、升级操作。

BOB

l  BOB是一个帮助带内网络远端主机通过带内组网与本机iBMC进行通信的转发工具。包括服务连接,如SSH、IPMI、HTTPS等;事件上报,如SNMP Trap等。

l  BOB支持服务管理(启动/停止/重启),不支持独立部署和工作。

l  BOB提供了一个命令行bobCmd,用于启动/停止/重启BOB服务以及其他相关配置,转发配置支持在线配置,无需重启服务。配置支持持久化,即重启系统后不会丢失。

iBMC事件转储

Linux/Windows系统上支持将iBMC事件转储至系统日志文件中。

说明

对于版本号为Vxxx格式的iBMC,需要配套V294及以上版本;对于版本号为x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。

Redfish服务兼容HTTPS协议

Redfish服务支持以HTTPS或HTTP协议启动。

说明

l  对于版本号为Vxxx格式的iBMC,需要配套V316及以上版本,如果是V316之前版本,配置成以HTTPS协议启动Redfish服务,则无法与iBMC通信;对于版本号为x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。

l  iBMA支持HTTP和HTTPS两种协议,HTTP协议明文传输,安全性较差;HTTPS协议密文传输,安全性较高。

网卡配置追溯

Linux系统支持周期性记录网卡配置信息。

说明

在Linux系统下,iBMA会定时收集网卡的ethtool最新配置信息,文件存储在iBMA安装目录的log/ethtool_log目录下,可以使用FusionServer Tools在收集操作系统日志时一并收集。

网卡故障检测

l  Linux系统支持Mellanox网卡的internal error检测,并记录在iBMA安装目录的log/common.log日志中。

说明

需配套Mellanox网卡4.2及之后的驱动版本。

l  VMware系统支持检测网口状态短时间变化事件并上报更新给iBMC。

存储诊断

定时监控硬盘IO性能降低、硬盘Sense Code错误和文件系统只读的存储诊断信息并上报给iBMC。支持RAID卡下硬盘日志的收集,用于硬盘耗损分析。

说明

l  硬盘IO性能降低和文件系统只读检测只支持Linux系统。

l  硬盘Sense Code错误检测支持Linux系统、ESXi 6.5及以上版本。

内存隔离

支持对操作系统出现故障的物理内存页,通过Redfish接口进行软隔离操作。

说明

l  FusionServer服务器上iBMA支持内存隔离的操作系统为:Redhat 7.3、Redhat 7.4、Redhat 7.5、Redhat 7.6 、CentOS 7.3、CentOS 7.4、CentOS 7.5、CentOS 7.6、CentOS 7.7、CentOS 7.8、CentOS 7.9、CentOS 8.0、CentOS 8.1、CentOS 8.2、CentOS 8.3、EulerOS 2.0 SP3、EulerOS 2.0 SP5和EulerOS 2.0 SP9系统。

 

iBMC通过iBMA的RESTful接口可实现服务器系统信息的查询功能,如表所示。

组件

描述

操作系统

查询OS的基本信息,包括主机名称、描述、OS的版本(主版本、子版本及补丁主版本及子版本)、内核版本、厂商、系统时间等。

CPU

查询CPU的基本信息,包括系统CPU占用率及CPU的个数,型号,单个CPU占用率等CPU信息。

GPU

查询GPU的基本信息,包括GPU利用率和GPU内存使用率。

NPU

查询NPU的基本信息,包括内存资源使用率、HBM资源使用率、内存带宽资源使用率、HBM带宽资源使用率、AiCore资源使用率、AiCpu资源使用率、CtrlCpu资源使用率。

内存

查询内存基本信息,包括查询系统的内存大小及占用率。

网口

查询网卡个数、规格速率、Link状态、OAM状态、双工模式、固件版本、驱动名、网卡驱动版本、槽位信息、PCI-E设备号、功能号、网口名、网口IP、掩码、网关、MAC地址、VLAN信息、收发包统计等,同时支持系统VLAN、Team及Bridge信息的查询。

查询物理网口的速率,当前占用率。

IB卡

查询IB卡个数、芯片型号、固件版本、驱动名、驱动版本、槽位信息、PCI-E设备号、UUID、网口类型、设备类型、功能号的全球唯一标识、全球唯一标识、默认gid、端口lid、SM lid、选路掩码、端口类型、能力地图、网口名、网口IP、掩码、网关、MAC地址、规格速率、Link状态、双工模式、自协商模式、MTU大小等信息。

说明

只支持Linux系统。

硬盘

查询物理硬盘个数、厂商、类型、固件版本、序列号、容量、转速、接口速率、物理槽位、硬盘丝印等信息查询。

查询物理硬盘状态(ONLINE/OFFLINE)、温度、运行时长、巡检状态、重构状态/进度、SMART信息等。

查询系统下逻辑盘的容量,已使用大小,使用率等信息。

RAID

支持主流RAID卡,支持服务器有多RAID卡场景。

查询RAID卡个数、控制器型号、固件版本、驱动版本、槽位信息、条带深度、Memory大小、ECC计数等。

查询RAID电池健康状态、电池类型、名称、序列号、额定容量、电压、当前容量、电压、充放电次数、温度等信息。

查询RAID逻辑盘的RAID级别信息、正常/降级/离线状态,获取RAID组配置状态,获取RAID组中的硬盘物理槽位信息,获取操作系统盘符与RAID组的关系、支持RAID组条带宽度、访问策略、读写策略、逻辑盘Cache状态及是否为启动盘等信息。

查询RAID卡链路误码,硬盘背板链路误码。

FC/FCoE

支持FC/FCoE卡的厂家、型号、固件版本、驱动版本、槽位信息、WWN、FC_ID、链路状态及端口信息的查询。

iSCSI

支持iSCSI的厂家、型号、固件版本、驱动版本、槽位信息、链路状态、端口数量及配置信息的查询。

NVMe

支持NVMe磁盘的厂家、型号、序列号、槽位信息、固件版本、驱动版本、硬盘状态、接口类型、介质类型、容量、最大速率、协商速率、SMART等信息的查询。

光模块

支持光模块基本信息显示。包括如下信息:厂家名称、厂家部件号、序列号、生产日期、光模块类型(10GBASE_SR)、波长、多模/单模,温度,电压,功耗的门限。

支持光模块诊断包括:光模块Los检测、温度、电压和功耗超过门限的检测。

支持光模块匹配检测(类型匹配和速率匹配):iBMA上报光模块类型和速率。

说明

只支持Linux系统。

OAM链路检测

刀片服务器OAM(802.3ah)检测,支持OAM链路故障检测,包括链路状态检测(误码越限、误帧越限或者误帧秒越限)。

说明

只支持Linux系统,配合E9000交换单板。

posted @ 2022-08-09 16:56  古道轻风  阅读(6174)  评论(0编辑  收藏  举报