Zabbix 模板
Zabbix服务器硬件监控模版 浪潮 NF系列、TS系列
分享到:

Zabbix服务器硬件监控模版 浪潮 NF系列、TS系列

监控浪潮服务器硬件是通过SNMP协议进行设备纳管,指标主要包含硬件状态、CPU状态、内存状态、接口状态、风扇、电源、SNMPTrap等。
模板介绍
支持的Zabbix版本 5.0及以上 监控纳管模式 SNMP


1     硬件服务器-浪潮模板概述

本文档适用于监控服务器硬件-浪潮。监控浪潮服务器硬件是通过SNMP协议进行设备纳管,指标主要包含硬件状态、CPU状态、内存状态、接口状态、风扇、电源、SNMPTrap等。

支持的Zabbix版本:5.0以上版本

支持的硬件服务器:浪潮;型号:NF系列M5/M6、TS系列M5

监控模板下载:


主模板_服务器硬件_浪潮_NF5280M5_SNMP.xml

主模板_服务器硬件_浪潮_NF5280M6_SNMP.xml

主模板_服务器硬件_浪潮_TS860M5_SNMP.xml


监控项见下图:

浪潮2.png

2     模板详情

2.1   模板宏

宏名称

宏描述

默认值

{$SECURITY_NAME}

SNMP v3名称

Administrator

{$SECURITY_PWD}

SNMP v3密码

Snmp@bmc

{$EXP}

snmptrap告警级别的运算符

gt

{$SEVERITY}

snmptrap告警级别的定义

1

{$OBJ.TYPE}

设备类型

服务器

{$SNMP_COMMUNITY}

SNMP协议团体名

Snmp@zabbix2022!


2.2   监控指标

指标组

监控指标项

Item名称

Item键值

触发器

FRU

FRU信息: {#SNMPVALUE}

FRU信息: {#SNMPVALUE}

inspur.server.fru.info.[{#SNMPVALUE}]


ICMP

ICMP   ping状态

ICMP   ping状态

icmpping[,5,,,]

[硬件设备]{HOST.NAME} BMC刚才发生过重启

ICMP   ping状态

ICMP   ping状态

icmpping[,5,,,]

[硬件设备]{HOST.NAME}失联,持续3分钟未响应,设备可能宕机

ICMP   丢包率

ICMP   丢包率

icmppingloss


ICMP   请求时长

ICMP   请求时长

icmppingsec


RAID

RAID卡状态: {#SNMPVALUE}

RAID卡状态: {#SNMPVALUE}

inspur.server.raid.status.

[{#SNMPVALUE}]

浪潮RAID卡[{#SNMPVALUE}]状态告警

SNMPTRAP

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Trap告警级别

Trap告警级别

snmptraps.severity


WATCHDOG

看门狗状态: {#SNMPVALUE}

看门狗状态: {#SNMPVALUE}

inspur.server.watchdog.status.

[{#SNMPVALUE}]

浪潮看门狗状态告警

cpu

型号{#SNMPVALUE}]

型号{#SNMPVALUE}]

cpu.infoModel[{#SNMPVALUE}]


数量{#SNMPVALUE}]

数量{#SNMPVALUE}]

cpu.infoCord[{#SNMPVALUE}]


热功率{#SNMPVALUE}]

热功率{#SNMPVALUE}]

cpu.DesignPower[{#SNMPVALUE}]


状态[{#SNMPVALUE}]

状态[{#SNMPVALUE}]

cpu.infoPresent[{#SNMPVALUE}]

{#SNMPVALUE}CPU状态异常

pcie

PCIE[{#SNMPVALUE}]的厂家

PCIE[{#SNMPVALUE}]的厂家

pcie.vender[{#SNMPVALUE}]


PCIE[{#SNMPVALUE}]的描述

PCIE[{#SNMPVALUE}]的描述

pcie.device[{#SNMPVALUE}]


PCIE[{#SNMPVALUE}]的状态

PCIE[{#SNMPVALUE}]的状态

pcie.status[{#SNMPVALUE}]


内存

厂商[{#SNMPVALUE}]

厂商[{#SNMPVALUE}]

memory.MFC[{#SNMPVALUE}]


带宽[{#SNMPVALUE}]

带宽[{#SNMPVALUE}]

memory.Datawidth[{#SNMPVALUE}]


序列号[{#SNMPVALUE}]

序列号[{#SNMPVALUE}]

memory.SerialNO[{#SNMPVALUE}]


状态[{#SNMPVALUE}]

状态[{#SNMPVALUE}]

memory.status[{#SNMPVALUE}]


编号[{#SNMPVALUE}]

编号[{#SNMPVALUE}]

memory.PartNo[{#SNMPVALUE}]


速率[{#SNMPVALUE}]

速率[{#SNMPVALUE}]

memory.Speed[{#SNMPVALUE}]


常规

BMC运行时间

BMC运行时间

sysUpTime

[硬件设备]{HOST.NAME} BMC刚才发生过重启

BMC运行时间

BMC运行时间

sysUpTime

[硬件设备]{HOST.NAME}SNMP无法采集到数据

BMC运行时间

BMC运行时间

sysUpTime

[硬件设备]{HOST.NAME}失联,持续3分钟未响应,设备可能宕机

设备位置

设备位置

sysLocation


设备名称

设备名称

sysName

[硬件设备]{HOST.NAME} 设备名称发生改变

设备描述

设备描述

sysDescr


设备详细的联系方式

设备详细的联系方式

sysContact


微软控制器

微软控制器状态: {#SNMPVALUE}

微软控制器状态:

{#SNMPVALUE}

inspur.server.microcontroller.status.

[{#SNMPVALUE}]

浪潮微控制器[{#SNMPVALUE}]状态告警

温度传感器

温度传感器上线限阈值[{#SNMPVALUE}]

温度传感器上线限阈值

[{#SNMPVALUE}]

temp.serious.up[{#SNMPVALUE}]


温度传感器下限阈值[{#SNMPVALUE}]

温度传感器下限阈值

[{#SNMPVALUE}]

temp.serious.LowNTR[{#SNMPVALUE}]


温度传感器严重上限阈值[{#SNMPVALUE}]

温度传感器严重上限阈值

[{#SNMPVALUE}]

temp.serious.upNRT[{#SNMPVALUE}]


温度传感器严重下限阈值[{#SNMPVALUE}]

温度传感器严重下限阈值

[{#SNMPVALUE}]

temp.serious.Low[{#SNMPVALUE}]


温度传感器当前读数[{#SNMPVALUE}]

温度传感器当前读数[{#SNMPVALUE}]

temp.value[{#SNMPVALUE}]

{HOST.NAME}   部位:

[{#SNMPVALUE}]温度持续10分钟达到80°C

温度传感器当前读数[{#SNMPVALUE}]

温度传感器当前读数[{#SNMPVALUE}]

temp.value[{#SNMPVALUE}]

{HOST.NAME}   部位:

[{#SNMPVALUE}]温度持续10分钟达到90°C

温度传感器状态[{#SNMPVALUE}]

温度传感器状态[{#SNMPVALUE}]

temp.status[{#SNMPVALUE}]

{HOST.NAME}   部位: [{#SNMPVALUE}]温度状态告警

电压

电压值: {#SNMPVALUE}

电压值: {#SNMPVALUE}

inspur.server.voltage.value.

[{#SNMPVALUE}]


电压状态: {#SNMPVALUE}

电压状态: {#SNMPVALUE}

inspur.server.voltage.status.

[{#SNMPVALUE}]

浪潮电压状态告警

电源

电源固件版本[{#SNMPVALUE}]

电源固件版本[{#SNMPVALUE}]

power.fwver[{#SNMPVALUE}]


电源序列号[{#SNMPVALUE}]

电源序列号[{#SNMPVALUE}]

power.seria[{#SNMPVALUE}]


电源状态[{#SNMPVALUE}]

电源状态[{#SNMPVALUE}]

power.status[{#SNMPVALUE}]


电源运行状态[{#SNMPVALUE}]

电源运行状态[{#SNMPVALUE}]

power.Present[{#SNMPVALUE}]

告警:电源当前状态{ITEM.VALUE}

磁盘

磁盘信息状态: {#SNMPVALUE}{#SNMPINDEX1}

磁盘信息状态:

{#SNMPVALUE}{#SNMPINDEX1}

inspur.server.disk.info.status.

[{#SNMPVALUE}{#SNMPINDEX1}]


磁盘挂载: {#SNMPVALUE}{#SNMPINDEX1}

磁盘挂载:

{#SNMPVALUE}{#SNMPINDEX1}

inspur.server.disk.info.attach.

[{#SNMPVALUE}{#SNMPINDEX1}]


磁盘模型: {#SNMPVALUE}{#SNMPINDEX1}

磁盘模型:

{#SNMPVALUE}{#SNMPINDEX1}

inspur.server.disk.info.model.

[{#SNMPVALUE}{#SNMPINDEX1}]


磁盘生产厂商: {#SNMPVALUE}{#SNMPINDEX1}

磁盘生产厂商:

{#SNMPVALUE}{#SNMPINDEX1}

inspur.server.disk.info.product.

[{#SNMPVALUE}{#SNMPINDEX1}]


磁盘空间大小: {#SNMPVALUE}{#SNMPINDEX1}

磁盘空间大小:

{#SNMPVALUE}{#SNMPINDEX1}

inspur.server.disk.info.size.

[{#SNMPVALUE}{#SNMPINDEX1}]


磁盘类型: {#SNMPVALUE}{#SNMPINDEX1}

磁盘类型:

{#SNMPVALUE}{#SNMPINDEX1}

inspur.server.disk.info.type.

[{#SNMPVALUE}{#SNMPINDEX1}]


管理子系统

管理子系统健康状态: {#SNMPVALUE}

管理子系统健康状态:

{#SNMPVALUE}

inspur.server.management.subsystem.

health.status.[{#SNMPVALUE}]

浪潮管理子系统状态告警

网卡

{#SNMPVALUE}   网卡物理连接状态

{#SNMPVALUE}   网卡物理连接状态

ifOperStatus[{#SNMPVALUE}]

[硬件设备]{HOST.NAME}网卡端口{#SNMPVALUE}已关闭

{#SNMPVALUE}   网卡描述

{#SNMPVALUE}   网卡描述

ifAlias[{#SNMPVALUE}]


{#SNMPVALUE}   网卡每秒发送速率

{#SNMPVALUE}   网卡每秒发送速率

ifHCOutOctetsPersecond[{#SNMPVALUE}]


{#SNMPVALUE}   网卡每秒接收速率

{#SNMPVALUE}   网卡每秒接收速率

ifHCInOctetsPersecond[{#SNMPVALUE}]


{#SNMPVALUE}   网卡物理地址

{#SNMPVALUE}   网卡物理地址

ifPhysAddress[{#SNMPVALUE}]


{#SNMPVALUE}   网卡类型

{#SNMPVALUE}   网卡类型

ifType[{#SNMPVALUE}]


网卡厂商[{#SNMPVALUE}]

网卡厂商[{#SNMPVALUE}]

net.mfc[{#SNMPVALUE}]


网卡状态[{#SNMPVALUE}]

网卡状态[{#SNMPVALUE}]

net.conn[{#SNMPVALUE}]


网卡的MAC[{#SNMPVALUE}]

网卡的MAC[{#SNMPVALUE}]

net.mac[{#SNMPVALUE}]


网卡运行状态[{#SNMPVALUE}]

网卡运行状态[{#SNMPVALUE}]

net.status[{#SNMPVALUE}]


风扇

风扇值[{#SNMPVALUE}]

风扇值[{#SNMPVALUE}]

inspur.server.fan.speed.value.

[{#SNMPVALUE}]


风扇当前读数: {#SNMPVALUE}

风扇当前读数: {#SNMPVALUE}

inspur.server.fan.speed.value.num.

[{#SNMPVALUE}]


风扇状态[{#SNMPVALUE}]

风扇状态[{#SNMPVALUE}]

inspur.server.fan.status.

[{#SNMPVALUE}]

风扇[{#SNMPVALUE}]状态异常

风扇转速率: {#SNMPVALUE}

风扇转速率: {#SNMPVALUE}

inspur.server.fan.speed.value.percent.

[{#SNMPVALUE}]



3     模板安装说明

3.1   监控前置条件

硬件服务器-浪潮开启SNMP V2协议,如被纳管设备与硬件服务器-浪潮存在防火墙,则需要开启UDP 161的策略;

导入硬件服务器-浪潮监控模板至Zabbix Web页面。


3.2   设备监控

3.2.1     主机添加

在zabbix web上新建host并关联硬件服务器-浪潮模板

3.2.2     修改主机宏

在zabbix web上的host配置中,点击“Marcos“菜单,选择“Inherited and hostmacros”,修改以下1个宏的值:

{$SNMP_COMMUNITY}:SNMP协议开启时配置的团体名,例如public (模板已存在默认路径,如与实际配置不相同,则修改)

3.2.3     查看最新数据


在zabbix web上点击“monitor”à”Latest data”,在“Hosts”选择新增的浪潮主机,最后点击“Apply”生效来查看最新数据。

浪潮1.png浪潮2.png



18001261978
上海市浦东新区龙东大道3000号 张江集电港1期 1号楼B区1206