Zabbix 模板
Zabbix操作系统监控模板 Windows
分享到:

Zabbix操作系统监控模板 Windows

通过Zabbix Agent进行设备纳管
监控指标主要包含CPU、内存、文件分区、磁盘IO、网络接口、进程等
支持的Zabbix版本:5.0以上版本
支持的WINDOWS版本:2003以上
模板介绍
支持的Zabbix版本 5.0及以上 监控纳管模式 Agent主动模式


1     WINDOWS模板概述

本文档适用于监控操作系统WINDOWS,WINDOWS是通过Zabbix Agent进行设备纳管,监控指标主要包含CPU、内存、文件分区、磁盘IO、网络接口、进程等。

支持的Zabbix版本:5.0以上版本

支持的WINDOWS版本:2003以上

监控模板下载:主模板_操作系统_Windows_主动.xml


windows监控模版-1.png

2     模板详情

2.1   模板宏

2.2   监控指标

指标组

监控指标项

Item名称

Item键值

触发器

CPU

CPU使用的百分比

CPU使用的百分比

system.cpu.util[]

[主机]{HOST.NAME}CPU总使用率持续10分钟大于80%

CPU使用的百分比

CPU使用的百分比

system.cpu.util[]

[主机]{HOST.NAME}CPU总使用率持续10分钟大于90%

{#CPU.NUMBER}   (使用百分比)

{#CPU.NUMBER}   (使用百分比)

system.cpu.util[{#CPU.NUMBER}]


处理器数量

处理器数量

system.cpu.num[online]

[主机]{HOST.NAME} CPU持续10分钟负载超过核心数

处理器数量

处理器数量

system.cpu.num[online]

[主机]{HOST.NAME} CPU持续10分钟负载超过核心数2倍

处理器负载(平均15分钟)

处理器负载(平均15分钟)

system.cpu.load[all,avg15]


处理器负载(平均1分钟)

处理器负载(平均1分钟)

system.cpu.load[all,avg1]

[主机]{HOST.NAME} CPU持续10分钟负载超过核心数

处理器负载(平均1分钟)

处理器负载(平均1分钟)

system.cpu.load[all,avg1]

[主机]{HOST.NAME} CPU持续10分钟负载超过核心数2倍

处理器负载(平均5分钟)

处理器负载(平均5分钟)

system.cpu.load[all,avg5]


PING

ICMP   ping状态

ICMP   ping状态

icmpping[,2,,,]

[主机]{HOST.NAME}失联,持续3分钟未响应,系统可能宕机

ICMP   丢包率

ICMP   丢包率

icmppingloss


ICMP   请求时长

ICMP   请求时长

icmppingsec


MEM

内存使用大小

内存使用大小

vm.memory.size[used]


内存剩余大小

内存剩余大小

vm.memory.size[free]


内存总大小

内存总大小

vm.memory.size[total]


物理内存使用百分比

物理内存使用百分比

vm.memory.size[pused]

[主机]{HOST.NAME}总内存使用率持续10分钟大于80%

物理内存使用百分比

物理内存使用百分比

vm.memory.size[pused]

[主机]{HOST.NAME}总内存使用率持续10分钟大于90%

Swap虚拟内存使用百分比

Swap虚拟内存使用百分比

system.swap.size[,pused]

[主机]{HOST.NAME}上Swap虚拟空间大于80%

Swap虚拟内存使用百分比

Swap虚拟内存使用百分比

system.swap.size[,pused]

[主机]{HOST.NAME}上Swap虚拟空间大于95%

Swap虚拟内存使用空间

Swap虚拟内存使用空间

system.swap.size[,used]


Swap虚拟内存剩余空间

Swap虚拟内存剩余空间

system.swap.size[,free]


Swap虚拟内存总空间

Swap虚拟内存总空间

system.swap.size[,total]


Agent

agent代理状态

agent代理状态

agent.ping

[主机] {HOST.NAME} Agent   

客户端无法正常采集数据,

系统可能宕机

agent代理状态

agent代理状态

agent.ping

[主机]{HOST.NAME}失联,持续3分钟未响应,系统可能宕机

zabbix_agent   版本

zabbix_agent   版本

agent.version

[主机]{HOST.NAME}上Monitor agent(d)版本发生改变

zabbix_agent   版本

zabbix_agent   版本

agent.version

[主机]{HOST.NAME}上代理版本发生改变

zabbix_agent   运行的主机名

zabbix_agent   运行的主机名

agent.hostname

[主机]{HOST.NAME}Monitor   agentd主机名发生改变

zabbix_agent   运行的主机名

zabbix_agent   运行的主机名

agent.hostname

[主机]{HOST.NAME}代理主机名发生改变

NET

{#IFNAME}   (网卡每秒发送丢包数)

{#IFNAME}   (网卡每秒发送丢包数)

net.if.out[{#IFNAME},dropped]


{#IFNAME}   (网卡每秒发送丢包率)

{#IFNAME}   (网卡每秒发送丢包率)

net.if.out[{#IFNAME},drop_rate]

[主机]{HOST.NAME}网卡{#IFNAME}发送丢包率大于50%

{#IFNAME}   (网卡每秒发送包数)

{#IFNAME}   (网卡每秒发送包数)

net.if.out[{#IFNAME},packets]


{#IFNAME}   (网卡每秒发送速率)

{#IFNAME}   (网卡每秒发送速率)

net.if.out[{#IFNAME}]


{#IFNAME}   (网卡每秒发送错误包数)

{#IFNAME}   (网卡每秒发送错误包数)

net.if.out[{#IFNAME},errors]


{#IFNAME}   (网卡每秒接收丢包数)

{#IFNAME}   (网卡每秒接收丢包数)

net.if.in[{#IFNAME},dropped]


{#IFNAME}   (网卡每秒接收丢包率)

{#IFNAME}   (网卡每秒接收丢包率)

net.if.in[{#IFNAME},drop_rate]

[主机]{HOST.NAME}网卡{#IFNAME}接收丢包率大于50%

{#IFNAME}   (网卡每秒接收包数)

{#IFNAME}   (网卡每秒接收包数)

net.if.in[{#IFNAME},packets]


{#IFNAME}   (网卡每秒接收速率)

{#IFNAME}   (网卡每秒接收速率)

net.if.in[{#IFNAME}]


{#IFNAME}   (网卡每秒接收错误包数)

{#IFNAME}   (网卡每秒接收错误包数)

net.if.in[{#IFNAME},errors]


网卡信息列表

网卡信息列表

net.if.list


DISK

{#FSNAME}   (使用磁盘空间百分比)

{#FSNAME}   (使用磁盘空间百分比)

vfs.fs.size[{#FSNAME},pused]

[主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于90%

{#FSNAME}   (使用磁盘空间百分比)

{#FSNAME}   (使用磁盘空间百分比)

vfs.fs.size[{#FSNAME},pused]

[主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于95%

{#FSNAME}   (使用磁盘空间百分比)

{#FSNAME}   (使用磁盘空间百分比)

vfs.fs.size[{#FSNAME},pused]

[主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于99%

{#FSNAME}   (剩余空间)

{#FSNAME}   (剩余空间)

vfs.fs.size[{#FSNAME},free]

[主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于99%

{#FSNAME}   (剩余空间占用百分比)

{#FSNAME}   (剩余空间占用百分比)

vfs.fs.size[{#FSNAME},pfree]


{#FSNAME}   (磁盘使用空间)

{#FSNAME}   (磁盘使用空间)

vfs.fs.size[{#FSNAME},used]


{#FSNAME}   (磁盘总空间)

{#FSNAME}   (磁盘总空间)

vfs.fs.size[{#FSNAME},total]


IO

IOPS:磁盘每秒IO的吞吐量

IOPS:磁盘每秒IO的吞吐量

perf_counter[\PhysicalDisk(_Total)\Disk

Transfers/sec]


IOPS:磁盘每秒的写IO数量

IOPS:磁盘每秒的写IO数量

perf_counter[\PhysicalDisk(_Total)\Disk

Writes/sec]


IOPS:磁盘每秒的读IO数量

IOPS:磁盘每秒的读IO数量

perf_counter[\PhysicalDisk(_Total)\Disk

Reads/sec]


当前磁盘队列长度

当前磁盘队列长度

perf_counter[\PhysicalDisk(_Total)

\Current Disk Queue Length]

[主机]{HOST.NAME}上磁盘当前队列长度持续5分钟大于2,

存储无法完全响应应用端发出的IO请求

操作系统将I/O请求分为多个磁盘

请求的比率

操作系统将I/O请求分为多个磁盘

请求的比率

perf_counter[\PhysicalDisk(_Total)\Split

IO/Sec]


文件每秒写入字节数

文件每秒写入字节数

perf_counter[\2\18]


文件每秒读取字节数

文件每秒读取字节数

perf_counter[\2\16]


磁盘上写数据的每秒传输量

磁盘上写数据的每秒传输量

perf_counter[\PhysicalDisk(_Total)\Disk   

Write Bytes/sec]


磁盘上总的数据每秒传输量

磁盘上总的数据每秒传输量

perf_counter[\PhysicalDisk(_Total)\Disk

   Bytes/sec]


磁盘上读数据的每秒传输量

磁盘上读数据的每秒传输量

perf_counter[\PhysicalDisk(_Total)\Disk

   Read Bytes/sec]


磁盘写入队列平均长度

磁盘写入队列平均长度

perf_counter[\234(_Total)\1404]


磁盘处理每个IO的平均时间

磁盘处理每个IO的平均时间

perf_counter[\PhysicalDisk(_Total)\Avg.

   Disk sec/Transfer]


磁盘平均每秒写入大小

磁盘平均每秒写入大小

perf_counter[\PhysicalDisk(_Total)\Avg.   

Disk Bytes/Write]


磁盘平均每秒读取大小

磁盘平均每秒读取大小

perf_counter[\PhysicalDisk(_Total)\Avg.

Disk Bytes/Read]


磁盘忙于处理写请求所占的时间的百分比

磁盘忙于处理写请求所占的时间的百分比

perf_counter[\PhysicalDisk(_Total)\%

Disk Write Time]


磁盘忙于处理读请求所占的时间的百分比

磁盘忙于处理读请求所占的时间的百分比

perf_counter[\PhysicalDisk(_Total)\%

Disk Read Time]


磁盘忙于服务读写请求的时间比率

磁盘忙于服务读写请求的时间比率

perf_counter[\PhysicalDisk(_Total)\%

Disk Time]

[主机]{HOST.NAME}上磁盘忙于服务读写请求的时间比率

高于99%,磁盘处于极度繁忙状态

磁盘每秒写IO的延时

磁盘每秒写IO的延时

perf_counter[\PhysicalDisk(_Total)\Avg.

Disk sec/Write]

[主机]{HOST.NAME} 磁盘每秒平均写延时持续10分钟

大于200ms

磁盘每秒读IO的延时

磁盘每秒读IO的延时

perf_counter[\PhysicalDisk(_Total)\Avg.

Disk sec/Read]

[主机]{HOST.NAME} 磁盘每秒平均读延时持续10分钟

大于200ms

磁盘读取队列平均长度

磁盘读取队列平均长度

perf_counter[\234(_Total)\1402]


INFO

系统信息

系统信息

system.uname

[主机]{HOST.NAME}主机信息发生改变

系统正常运行时间

系统正常运行时间

system.uptime

[主机] {HOST.NAME} Agent   

客户端无法正常采集数据,系统可能宕机

系统正常运行时间

系统正常运行时间

system.uptime

[主机]{HOST.NAME} 刚才发生重启

PROC

线程数

线程数

perf_counter[\2\250]


系统进程

系统进程

system.subprocess


进程总量

进程总量

proc.num[]

[主机]{HOST.NAME}上进程数过多(超过1000)


3     模板安装说明

3.1   监控前置条件

导入WINDOWS监控模板至Zabbix Web页面;

需要存在已安装配置的zabbix agent程序;


3.2   设备监控

3.2.1     主机添加

在zabbix web上新建host并关联WINDOWS模板

3.2.2     修改主机宏

3.2.3     查看最新数据

在zabbix web上点击“monitor”à”Latest data”,在“Hosts”选择新增的WINDOWS主机,最后点击“Apply”生效来查看最新数据。


20230518


windows监控模版-1.png

18001261978
上海市浦东新区龙东大道3000号 张江集电港1期 1号楼B区1206