Zabbix 模板
Zabbix服务器硬件监控模版 Dell服务器PowerEdge R系列
分享到:

Zabbix服务器硬件监控模版 Dell服务器PowerEdge R系列

通过SNMP方式,监控戴尔/Dell服务器的硬件系统信息,包括:控制器信息、内存信息、网卡信息、处理器信息、硬盘信息、温度信息、电源信息和风扇信息等
模板介绍
支持的Zabbix版本 5.0及以上 监控纳管模式 SNMP

1    硬件服务器-戴尔模板概述

本文档适用于监控硬件服务器-戴尔。硬件服务器-戴尔是通过SNMP协议进行设备纳管,指标主要包含硬件状态、CPU状态、内存状态、接口状态、风扇、电源、SNMPTrap等。

支持的Zabbix版本:5.0以上版本

支持的硬件服务器:戴尔;型号:R系列

监控模板下载:主模板_服务器硬件_戴尔_R系列_SNMP.xml


Dell服务器硬件监控模版R740-指标展示1.png

2    模板详情

2.1   模板宏

宏名称

宏描述

默认值

{$EXP}

snmptrap告警级别的运算符

gt

{$SEVERITY}

snmptrap告警级别的定义

1

{$OBJ.TYPE}

设备类型

戴尔服务器

{$SNMP_COMMUNITY}

SNMP团体名

pubilc

2.2   监控指标

指标组

监控指标项

Item名称

Item键值

触发器

CPU

品牌名称

{#CPU}   品牌名称

ProcBrandName.[{#SNMPINDEX}]


线程数量

{#CPU}   线程数量

ProcThreadCount.[{#SNMPINDEX}]


制造商名称

{#CPU} 制造商名称

ProcManuName.[{#SNMPINDEX}]


外主频

{#CPU} 外主频

ProcExternalClockSpeed[{#SNMPINDEX}]


当前主频

{#CPU} 当前主频

ProcCurrentSpeed.[{#SNMPINDEX}]


最大主频

{#CPU} 最大主频

ProcCurrentMaxSpeed[{#SNMPINDEX}]


核心数量

{#CPU} 核心数量

ProcCoresNum.[{#SNMPINDEX}]


状态

{#CPU} 状态

ProcStatus.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   处理器 {#CPU} 状态异常

状态

{#CPU} 状态

ProcStatus.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   处理器 {#CPU} 状态警告

Fans

状态

{#FAN} 状态

FanStatus[{#SNMPINDEX}]

[硬件设备]{HOSTNAME}   风扇 {#FAN} 总体状态异常

状态

{#FAN} 状态

FanStatus[{#SNMPINDEX}]

[硬件设备]{HOSTNAME}   风扇 {#FAN} 总体状态警告

转速

{#FAN} 转速

FanSpeed[{#SNMPINDEX}]

[硬件设备]{HOSTNAME}   风扇 {#FAN} 转速低于最低阈值

ICMP

ICMP ping状态

ICMP ping状态

icmpping[,5,,,]

[硬件设备]{HOST.NAME}   ——BMC刚才发生过重启

ICMP ping状态

ICMP ping状态

icmpping[,5,,,]

[硬件设备]{HOST.NAME}——SNMP无法采集到数据

ICMP ping状态

ICMP ping状态

icmpping[,5,,,]

[硬件设备]{HOST.NAME}——持续3分钟未响应。

ICMP 丢包率

ICMP 丢包率

icmppingloss


ICMP 请求时长

ICMP 请求时长

icmppingsec


SNMPTRAP

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Snmptrap原始告警

Snmptrap原始告警

snmptraps

硬件发生SNMPTrap告警,告警内容:{ITEM.VALUE}

Trap告警级别

Trap告警级别

snmptraps.severity


内存

主频

{#MEM} 主频

MemSpeed[{#SNMPINDEX}]


制造商

{#MEM} 制造商

MemManufacturer[{#SNMPINDEX}]


大小

{#MEM} 大小

MemSize[{#SNMPINDEX}]


序列号

{#MEM} 序列号

MemSerialNo[{#SNMPINDEX}]


最大主频

{#MEM} 最大主频

MemMaxSpeed[{#SNMPINDEX}]


状态

{#MEM} 状态

MemStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   内存 {#MEM} 警告

状态

{#MEM} 状态

MemStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   内存 {#MEM} 错误

零件号

{#MEM} 零件号

MemPartlNo[{#SNMPINDEX}]


常规

BMC运行时间

BMC运行时间

sysUpTime

[硬件设备]{HOST.NAME}   ——BMC刚才发生过重启

BMC运行时间

BMC运行时间

sysUpTime

[硬件设备]{HOST.NAME}——SNMP无法采集到数据

BMC运行时间

BMC运行时间

sysUpTime

[硬件设备]{HOST.NAME}——持续3分钟未响应。

设备位置

设备位置

sysLocation


设备名称

设备名称

sysName

[硬件设备]{HOST.NAME}   ——设备名称发生改变

设备描述

设备描述

sysDescr


设备详细的联系方式

设备详细的联系方式

sysContact


扩展总线

位宽

{#PCIE} 位宽

PCIeRatedWidth[{#SNMPINDEX}]


厂家

{#PCIE} 厂家

PCIeMfc[{#SNMPINDEX}]


描述

{#PCIE} 描述

PCIeDesc[{#SNMPINDEX}]


状态

{#PCIE} 状态

PCIeStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   扩展总线 {#PCIE} 状态异常

状态

{#PCIE} 状态

PCIeStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   扩展总线 {#PCIE} 状态警告

槽位

状态

{#SLOT} 状态

SlotStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   系统槽位 {#SLOT} 状态异常

状态

{#SLOT} 状态

SlotStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   系统槽位 {#SLOT} 状态警告

温度

临界的上限

{#TEMP} 临界的上限

TempCritUpLimit.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 超过临界上限值

临界的上限

{#TEMP} 临界的上限

TempCritUpLimit.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 高于警告值

临界的下限

{#TEMP} 临界的下限

TempCritLowLimit.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 低于临界下限值

临界的下限

{#TEMP} 临界的下限

TempCritLowLimit.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 低于警告值

温度值

{#TEMP} 温度值

TempValue.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 低于临界下限值

温度值

{#TEMP} 温度值

TempValue.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 低于警告值

温度值

{#TEMP} 温度值

TempValue.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 超过临界上限值

温度值

{#TEMP} 温度值

TempValue.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 高于警告值

状态

{#TEMP} 状态

TempStatus.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度传感器 {#TEMP} 状态异常

状态

{#TEMP} 状态

TempStatus.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度传感器 {#TEMP} 状态警告

警告的上限

{#TEMP} 警告的上限

TempWarnUpLimit.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 高于警告值

警告的下限

{#TEMP} 警告的下限

TempWarnLowLimit.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   温度 {#TEMP} 低于警告值

电压

电压状态

{#VOLTAGE} : 电压状态

VoltageStatus.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   电压组件 {#VOLTAGE} 状态异常

电压状态

{#VOLTAGE} : 电压状态

VoltageStatus.[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   电压组件 {#VOLTAGE} 状态警告

电压状态

电压状态

VoltageStatusCombined

[硬件设备]{HOST.NAME}   电压异常

电池

电流传感器状态

{#AMP} 电流传感器状态

AmpsStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   电流传感器 {#AMP} 状态异常

电流传感器读数

{#AMP} 电流传感器读数

AmpsValue[{#SNMPINDEX}]


电池状态

{#BAT} 电池状态

battery.status[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   电池 {#AMP} 状态异常

电池状态

{#BAT} 电池状态

battery.status[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   电池 {#AMP} 状态警告

电源

传感器状态

{#POWER} 传感器状态

PowerSupplySensorState[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   电源传感器 {#POWER} 状态异常

当前输入电压

{#POWER} 当前输入电压

PowerSupplyInputVoltage[{#SNMPINDEX}]


最大功率

{#POWER} 最大功率

PowerSupplyMaxPower[{#SNMPINDEX}]


最大输入电压

{#POWER} 最大输入电压

PowerSupplyInputMaxVoltage[{#SNMPINDEX}]


状态

{#POWER} 状态

PowerSupplyStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   电源 {#POWER} 状态异常

状态

{#POWER} 状态

PowerSupplyStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   电源 {#POWER} 状态警告

状态设置

{#POWER} 状态设置

PowerSupplyStateSettings[{#SNMPINDEX}]


额定功率

{#POWER} 额定功率

PowerSupplyPower[{#SNMPINDEX}]


电源传感器状态

电源传感器状态

PowerUsageSensorStatus


电源无功功率

电源无功功率

PowerUsageMinIdle


系统总体电源状态

系统总体电源状态

GlobalSystemPowerState

[硬件设备]{HOST.NAME}   系统没有运行

磁盘/存储

RAID 控制器名称

RAID 控制器名称

RAIDControllerName


RAID 控制器固件版本

RAID 控制器固件版本

RAIDControllerFirmware


RAID 控制器状态

RAID 控制器状态

RAIDControllerStatus

[硬件设备]{HOST.NAME}   raid控制器错误

卷Raid级别

{#VOLNAME} : 卷Raid级别

VolumeState[{#SNMPINDEX}]


卷名称

{#VOLNAME} : 卷名称

VolumeName[{#SNMPINDEX}]


卷大小

{#VOLNAME} : 卷大小

VolumeSize[{#SNMPINDEX}]


卷总体状态

{#VOLNAME} : 卷总体状态

VolumeStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   {#VOLNAME} 卷总体状态异常

卷总体状态

{#VOLNAME} : 卷总体状态

VolumeStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   {#VOLNAME} 卷总体状态警告

卷运行状态

{#VOLNAME} : 卷运行状态

VolumeDiskState[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   {#VOLNAME} 卷运行状态异常

系统总体存储器状态

系统总体存储器状态

GlobalSystemStorageStatus

[硬件设备]{HOST.NAME}   存储器系统状态警告

系统总体存储器状态

系统总体存储器状态

GlobalSystemStorageStatus

[硬件设备]{HOST.NAME}   存储器系统状态错误

移动单元

厂商

{#FRU} 厂商

FRUMfc[{#SNMPINDEX}]


序列号

{#FRU} 序列号

FRUSerial[{#SNMPINDEX}]


状态

{#FRU} 状态

FRUStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   电流传感器 {#FRU} 状态异常

状态

{#FRU} 状态

FRUStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   电流传感器 {#FRU} 状态警告

部件号

{#FRU} 部件号

FRUPartNumber[{#SNMPINDEX}]


系统信息

BIOS 版本

BIOS 版本

BiosVersion


BIOS 状态

BIOS 状态

SystemBiosStatus


BIOS 生产日期

BIOS 生产日期

BiosDate


CMOS 电池状态

CMOS 电池状态

CMOSBatteryStatus

[硬件设备]{HOST.NAME}   CMOS 电池异常

iDRAC 固件版本

iDRAC 固件版本

idrac_firmwareversion


iDRAC 版本

iDRAC 版本

idrac_version


iDRAC 访问地址

iDRAC 访问地址

idrac_acessurl


型号

型号

systemModelName


标记号

标记号

idrac_assettag


系统名称

系统名称

systemOSName


系统整体LCD状态

系统整体LCD状态

GlobalSystemLCDStatus


系统服务号

系统服务号

idrac_esc


系统汇总状态

系统汇总状态

GlobalSystemRollupStatus

[硬件设备]{HOST.NAME}   iDrac 5分钟无数据

系统汇总状态

系统汇总状态

GlobalSystemRollupStatus

[硬件设备]{HOST.NAME}   发生严重错误

系统汇总状态

系统汇总状态

GlobalSystemRollupStatus

[硬件设备]{HOST.NAME}   发生警告错误

网卡

MAC地址

{#NETIF} : MAC地址

NetMAC[{#SNMPINDEX}]


厂商名称

{#NETIF} : 厂商名称

NetVenName[{#SNMPINDEX}]


名称

{#NETIF} : 名称

NetName[{#SNMPINDEX}]


总体状态

{#NETIF} : 总体状态

NetStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   网卡 {#NETIF} 总体状态异常

总体状态

{#NETIF} : 总体状态

NetStatus[{#SNMPINDEX}]

[硬件设备]{HOST.NAME}   网卡 {#NETIF} 总体状态警告

槽位

{#NETIF} : 槽位

NetSlot[{#SNMPINDEX}]


运行状态

{#NETIF} : 运行状态

NetConnStatus[{#SNMPINDEX}]

[硬件设备]{#HOSTNAME}   网卡 {#NETIF} 运行状态变化

网卡物理连接状态

{#SNMPVALUE}   网卡物理连接状态

ifOperStatus[{#SNMPVALUE}]

[硬件设备]{HOST.NAME}——网卡端口{#SNMPVALUE}已关闭

网卡描述

{#SNMPVALUE} 网卡描述

ifAlias[{#SNMPVALUE}]


网卡每秒发送速率

{#SNMPVALUE} 网卡每秒发送速率

ifHCOutOctetsPersecond[{#SNMPVALUE}]


网卡每秒接收速率

{#SNMPVALUE} 网卡每秒接收速率

ifHCInOctetsPersecond[{#SNMPVALUE}]


网卡物理地址

{#SNMPVALUE} 网卡物理地址

ifPhysAddress[{#SNMPVALUE}]


网卡类型

{#SNMPVALUE} 网卡类型

ifType[{#SNMPVALUE}]


风扇

转速下限

{#FAN} 转速下限

FanLowerSpeed[{#SNMPINDEX}]

[硬件设备]{HOSTNAME}   风扇 {#FAN} 转速低于最低阈值

3    模板安装说明

3.1   监控前置条件

硬件服务器-戴尔开启SNMP V2协议,如被纳管设备与硬件服务器-戴尔存在防火墙,则需要开启UDP 161的策略;

导入硬件服务器-戴尔监控模板至Zabbix Web页面。

3.2   设备监控

3.2.1   主机添加

在zabbix web上新建host并关联硬件服务器-戴尔模板

3.2.2   修改主机宏

在zabbix web上的host配置中,点击“Marcos“菜单,选择“Inheritedand host macros”,修改以下1个宏的值:

{$SNMP_COMMUNITY}:SNMP协议开启时配置的团体名,例如public (模板已存在默认路径,如与实际配置不相同,则修改)

3.2.3   查看最新数据

在zabbix web上点击“monitor”à”Latest data”,在“Hosts”选择新增的戴尔主机,最后点击“Apply”生效来查看最新数据。


Dell服务器硬件监控模版R740-指标展示2.png



      Dell服务器硬件监控模版R740-指标展示1.png

18001261978
上海市浦东新区龙东大道3000号 张江集电港1期 1号楼B区1206