指标组 | 监控指标项 | Item名称 | Item键值 | 触发器 |
CPU | CPU使用的百分比 | CPU使用的百分比 | system.cpu.util[] | [主机]{HOST.NAME}CPU总使用率持续10分钟大于80% |
CPU使用的百分比 | CPU使用的百分比 | system.cpu.util[] | [主机]{HOST.NAME}CPU总使用率持续10分钟大于90% |
{#CPU.NUMBER} (使用百分比) | {#CPU.NUMBER} (使用百分比) | system.cpu.util[{#CPU.NUMBER}] |
|
处理器数量 | 处理器数量 | system.cpu.num[online] | [主机]{HOST.NAME} CPU持续10分钟负载超过核心数 |
处理器数量 | 处理器数量 | system.cpu.num[online] | [主机]{HOST.NAME} CPU持续10分钟负载超过核心数2倍 |
处理器负载(平均15分钟) | 处理器负载(平均15分钟) | system.cpu.load[all,avg15] |
|
处理器负载(平均1分钟) | 处理器负载(平均1分钟) | system.cpu.load[all,avg1] | [主机]{HOST.NAME} CPU持续10分钟负载超过核心数 |
处理器负载(平均1分钟) | 处理器负载(平均1分钟) | system.cpu.load[all,avg1] | [主机]{HOST.NAME} CPU持续10分钟负载超过核心数2倍 |
处理器负载(平均5分钟) | 处理器负载(平均5分钟) | system.cpu.load[all,avg5] |
|
PING | ICMP ping状态 | ICMP ping状态 | icmpping[,2,,,] | [主机]{HOST.NAME}失联,持续3分钟未响应,系统可能宕机 |
ICMP 丢包率 | ICMP 丢包率 | icmppingloss |
|
ICMP 请求时长 | ICMP 请求时长 | icmppingsec |
|
MEM | 内存使用大小 | 内存使用大小 | vm.memory.size[used] |
|
内存剩余大小 | 内存剩余大小 | vm.memory.size[free] |
|
内存总大小 | 内存总大小 | vm.memory.size[total] |
|
物理内存使用百分比 | 物理内存使用百分比 | vm.memory.size[pused] | [主机]{HOST.NAME}总内存使用率持续10分钟大于80% |
物理内存使用百分比 | 物理内存使用百分比 | vm.memory.size[pused] | [主机]{HOST.NAME}总内存使用率持续10分钟大于90% |
Swap虚拟内存使用百分比 | Swap虚拟内存使用百分比 | system.swap.size[,pused] | [主机]{HOST.NAME}上Swap虚拟空间大于80% |
Swap虚拟内存使用百分比 | Swap虚拟内存使用百分比 | system.swap.size[,pused] | [主机]{HOST.NAME}上Swap虚拟空间大于95% |
Swap虚拟内存使用空间 | Swap虚拟内存使用空间 | system.swap.size[,used] |
|
Swap虚拟内存剩余空间 | Swap虚拟内存剩余空间 | system.swap.size[,free] |
|
Swap虚拟内存总空间 | Swap虚拟内存总空间 | system.swap.size[,total] |
|
Agent | agent代理状态 | agent代理状态 | agent.ping | [主机] {HOST.NAME} Agent 客户端无法正常采集数据, 系统可能宕机 |
agent代理状态 | agent代理状态 | agent.ping | [主机]{HOST.NAME}失联,持续3分钟未响应,系统可能宕机 |
zabbix_agent 版本 | zabbix_agent 版本 | agent.version | [主机]{HOST.NAME}上Monitor agent(d)版本发生改变 |
zabbix_agent 版本 | zabbix_agent 版本 | agent.version | [主机]{HOST.NAME}上代理版本发生改变 |
zabbix_agent 运行的主机名 | zabbix_agent 运行的主机名 | agent.hostname | [主机]{HOST.NAME}Monitor agentd主机名发生改变 |
zabbix_agent 运行的主机名 | zabbix_agent 运行的主机名 | agent.hostname | [主机]{HOST.NAME}代理主机名发生改变 |
NET | {#IFNAME} (网卡每秒发送丢包数) | {#IFNAME} (网卡每秒发送丢包数) | net.if.out[{#IFNAME},dropped] |
|
{#IFNAME} (网卡每秒发送丢包率) | {#IFNAME} (网卡每秒发送丢包率) | net.if.out[{#IFNAME},drop_rate] | [主机]{HOST.NAME}网卡{#IFNAME}发送丢包率大于50% |
{#IFNAME} (网卡每秒发送包数) | {#IFNAME} (网卡每秒发送包数) | net.if.out[{#IFNAME},packets] |
|
{#IFNAME} (网卡每秒发送速率) | {#IFNAME} (网卡每秒发送速率) | net.if.out[{#IFNAME}] |
|
{#IFNAME} (网卡每秒发送错误包数) | {#IFNAME} (网卡每秒发送错误包数) | net.if.out[{#IFNAME},errors] |
|
{#IFNAME} (网卡每秒接收丢包数) | {#IFNAME} (网卡每秒接收丢包数) | net.if.in[{#IFNAME},dropped] |
|
{#IFNAME} (网卡每秒接收丢包率) | {#IFNAME} (网卡每秒接收丢包率) | net.if.in[{#IFNAME},drop_rate] | [主机]{HOST.NAME}网卡{#IFNAME}接收丢包率大于50% |
{#IFNAME} (网卡每秒接收包数) | {#IFNAME} (网卡每秒接收包数) | net.if.in[{#IFNAME},packets] |
|
{#IFNAME} (网卡每秒接收速率) | {#IFNAME} (网卡每秒接收速率) | net.if.in[{#IFNAME}] |
|
{#IFNAME} (网卡每秒接收错误包数) | {#IFNAME} (网卡每秒接收错误包数) | net.if.in[{#IFNAME},errors] |
|
网卡信息列表 | 网卡信息列表 | net.if.list |
|
DISK | {#FSNAME} (使用磁盘空间百分比) | {#FSNAME} (使用磁盘空间百分比) | vfs.fs.size[{#FSNAME},pused] | [主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于90% |
{#FSNAME} (使用磁盘空间百分比) | {#FSNAME} (使用磁盘空间百分比) | vfs.fs.size[{#FSNAME},pused] | [主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于95% |
{#FSNAME} (使用磁盘空间百分比) | {#FSNAME} (使用磁盘空间百分比) | vfs.fs.size[{#FSNAME},pused] | [主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于99% |
{#FSNAME} (剩余空间) | {#FSNAME} (剩余空间) | vfs.fs.size[{#FSNAME},free] | [主机]{HOST.NAME}上{#FSNAME}分区磁盘空间使用率高于99% |
{#FSNAME} (剩余空间占用百分比) | {#FSNAME} (剩余空间占用百分比) | vfs.fs.size[{#FSNAME},pfree] |
|
{#FSNAME} (磁盘使用空间) | {#FSNAME} (磁盘使用空间) | vfs.fs.size[{#FSNAME},used] |
|
{#FSNAME} (磁盘总空间) | {#FSNAME} (磁盘总空间) | vfs.fs.size[{#FSNAME},total] |
|
IO | IOPS:磁盘每秒IO的吞吐量 | IOPS:磁盘每秒IO的吞吐量 | perf_counter[\PhysicalDisk(_Total)\Disk Transfers/sec] |
|
IOPS:磁盘每秒的写IO数量 | IOPS:磁盘每秒的写IO数量 | perf_counter[\PhysicalDisk(_Total)\Disk Writes/sec] |
|
IOPS:磁盘每秒的读IO数量 | IOPS:磁盘每秒的读IO数量 | perf_counter[\PhysicalDisk(_Total)\Disk Reads/sec] |
|
当前磁盘队列长度 | 当前磁盘队列长度 | perf_counter[\PhysicalDisk(_Total) \Current Disk Queue Length] | [主机]{HOST.NAME}上磁盘当前队列长度持续5分钟大于2, 存储无法完全响应应用端发出的IO请求 |
操作系统将I/O请求分为多个磁盘 请求的比率 | 操作系统将I/O请求分为多个磁盘 请求的比率 | perf_counter[\PhysicalDisk(_Total)\Split IO/Sec] |
|
文件每秒写入字节数 | 文件每秒写入字节数 | perf_counter[\2\18] |
|
文件每秒读取字节数 | 文件每秒读取字节数 | perf_counter[\2\16] |
|
磁盘上写数据的每秒传输量 | 磁盘上写数据的每秒传输量 | perf_counter[\PhysicalDisk(_Total)\Disk Write Bytes/sec] |
|
磁盘上总的数据每秒传输量 | 磁盘上总的数据每秒传输量 | perf_counter[\PhysicalDisk(_Total)\Disk Bytes/sec] |
|
磁盘上读数据的每秒传输量 | 磁盘上读数据的每秒传输量 | perf_counter[\PhysicalDisk(_Total)\Disk Read Bytes/sec] |
|
磁盘写入队列平均长度 | 磁盘写入队列平均长度 | perf_counter[\234(_Total)\1404] |
|
磁盘处理每个IO的平均时间 | 磁盘处理每个IO的平均时间 | perf_counter[\PhysicalDisk(_Total)\Avg. Disk sec/Transfer] |
|
磁盘平均每秒写入大小 | 磁盘平均每秒写入大小 | perf_counter[\PhysicalDisk(_Total)\Avg. Disk Bytes/Write] |
|
磁盘平均每秒读取大小 | 磁盘平均每秒读取大小 | perf_counter[\PhysicalDisk(_Total)\Avg. Disk Bytes/Read] |
|
磁盘忙于处理写请求所占的时间的百分比 | 磁盘忙于处理写请求所占的时间的百分比 | perf_counter[\PhysicalDisk(_Total)\% Disk Write Time] |
|
磁盘忙于处理读请求所占的时间的百分比 | 磁盘忙于处理读请求所占的时间的百分比 | perf_counter[\PhysicalDisk(_Total)\% Disk Read Time] |
|
磁盘忙于服务读写请求的时间比率 | 磁盘忙于服务读写请求的时间比率 | perf_counter[\PhysicalDisk(_Total)\% Disk Time] | [主机]{HOST.NAME}上磁盘忙于服务读写请求的时间比率 高于99%,磁盘处于极度繁忙状态 |
磁盘每秒写IO的延时 | 磁盘每秒写IO的延时 | perf_counter[\PhysicalDisk(_Total)\Avg. Disk sec/Write] | [主机]{HOST.NAME} 磁盘每秒平均写延时持续10分钟 大于200ms |
磁盘每秒读IO的延时 | 磁盘每秒读IO的延时 | perf_counter[\PhysicalDisk(_Total)\Avg. Disk sec/Read] | [主机]{HOST.NAME} 磁盘每秒平均读延时持续10分钟 大于200ms |
磁盘读取队列平均长度 | 磁盘读取队列平均长度 | perf_counter[\234(_Total)\1402] |
|
INFO | 系统信息 | 系统信息 | system.uname | [主机]{HOST.NAME}主机信息发生改变 |
系统正常运行时间 | 系统正常运行时间 | system.uptime | [主机] {HOST.NAME} Agent 客户端无法正常采集数据,系统可能宕机 |
系统正常运行时间 | 系统正常运行时间 | system.uptime | [主机]{HOST.NAME} 刚才发生重启 |
PROC | 线程数 | 线程数 | perf_counter[\2\250] |
|
系统进程 | 系统进程 | system.subprocess |
|
进程总量 | 进程总量 | proc.num[] | [主机]{HOST.NAME}上进程数过多(超过1000) |