ZABBIX 1.8 Russian 4 Настройка

Zabbix, реагируя на события, выполняет множество операций. Действия могут быть определены для любого события или набора событий, генерируемых Zabbix.

Параметр Описание
Имя Уникальное имя действия.
Событие Источник события.
В данный момент поддерживаются несколько источников:
Триггеры – события генерируемые изменениями состояния триггеров
Обнаружение – события генерируемые модулем сетевого автообнаружения
Авторегистрация события генерируемые новыми активными агентами
Включить эскалации Включение эскалаций. Если включено, то действие будет эскалировано по определенным шагам операции, определенным для операций.
Период (секунд) Интервал времени для перехода на следующий шаг при эскалации.
Тема по умолчанию Тема оповещения по умолчанию. Тема может содержать макросы.
Сообщение по умолчанию Сообщение оповещения по умолчанию. Сообщение может содержать макросы.
Сообщение восстановления Если включено, то Zabbix будет отправлять сообщение после устранения проблемы. Сообщения будут отправлены только тем кто получал любые сообщения по этой проблеме ранее.
Тема восстановления Тема сообщения при восстановлении. Тема может содержать макросы.
Сообщение восстановления Сообщение оповещения при восстановления. Сообщение может содержать макросы.
Состояние Состояние действия:
Активировано действие включено
Деактивировано действие отключено

Условия действия

Действие будет выполнено только в случае, если оно соответствует определенному набору условий.

Следующие условия могут быть определены для событий, источником которых есть изменение триггеров:

Тип условия Поддерживаемые операнды Описание
Группа элементов данных =
содержит
не содержит
= событие произошло от триггера, элемент данных которого включен в указанную группу элементов данных
содержит событие произошло от триггера, элемент данных которого включен в указанную группу элементов данных, содержащей указанную строку
не содержит событие произошло от триггера, элемент данных которого включен в указанную группу элементов данных, не содержащей указанную строку
Группа узлов сети = Сравнивает имеется ли в группе узлов сети триггер, сгенерировавший событие.
= Событие сгенерировано из указанной группы узлов сети
Событие сгенерировано не из указанной группы узлов сети
Шаблон узла сети = Сравнивает имеется ли в шаблоне узла сети сработавший триггер.
= Событие сгенерировано триггером находящемся в шаблоне узла сети
Событие сгенерировано триггером не находящемся в шаблоне узла сети
Узел сети = Сравнение имеется ли сработавший триггер в узле сети.
= Событие сгенерировано из указанного узла сети
Событие сгенерировано не из указанного узла сети
Триггер = Сравнение указанного триггера со сработавшим триггером.
= Событие сгенерировано указанным триггером
Событие сгенерировано не указанным триггером
Описание триггера (имя) содержит
не содержит
Сравнение совпадает ли имя триггера с именем триггера сгенерировавшим событие.
содержит Строка найдена в имени триггера. Регистрозависимое.
не содержит – Строка не найдена в имени триггера. Регистрозависимое.
Обратите внимание: Введенное значение будет сравниваться с описанием триггера (именем) со всеми раскрытыми макросами.
Важность триггера =

=
=

Сравнение с важностью триггера. = равно важности триггера
не равен важности триггера
= равен или более важный триггер
= равен или менее важный триггер
Значение триггера = Сравнение со значением триггера.
= равно значению триггера (OK или ПРОБЛЕМА)
Период времени в
не в
Событие произошло в указанный промежуток времени.
в – Событие произошло в указанный период времени.
Смотрите страницу спецификаций периода времени для получения сведений о формате времени.
Состояние обслуживания = Сравнение находится ли узел сети в обслуживании.
= Узел сети находится на обслуживании.
Узел сети не находится на обслуживании.

Значение (состояние) триггера:

Состояние триггера изменяется с ОК на ПРОБЛЕМА (значение триггера ПРОБЛЕМА)
Состояние триггера изменяется с ПРОБЛЕМА на ОК (значение триггера ОК)

Если состояние изменяется в такой последовательности ОК→НЕИЗВЕСТНО→ПРОБЛЕМА, то это рассматривается как ОК→ПРОБЛЕМА, и если ПРОБЛЕМА→НЕИЗВЕСТНО→ОК то это рассматривается как ПРОБЛЕМА→ОК.

Следующие условия действий могут быть определены для событий, возникающих при Обнаружении:

Тип условия Поддерживаемые операнды Описание
IP узла сети = Проверяется входит ли IP адрес обнаруженного Узла сети в указанный диапазон.
= IP узла сети входит в диапазон
IP узла сети не входит в диапазон.
Тип сервиса = Проверяется тип сервиса обнаруженного устройства.
= совпадает тип сервиса обнаруженного устройства
не совпадает тип сервиса обнаруженного устройства.
Порт сервиса = Проверяется входит ли номер TCP порта в указанный диапазон портов.
= порт входит в диапазон
порт не входит в диапазон.
Правило обнаружения = Проверяется соответствует ли указанному правилу обнаружения обнаруженный узел сети.
= не соответствует указанному правилу обнаружения
соответствует указанному правилу обнаружения.
Проверка обнаружения = Проверяется соответствует ли указанной проверке обнаружения обнаруженный узел сети.
= соответствует указанной проверке обнаружения
не соответствует указанной проверке обнаружения.
Обнаруженный объект = Проверяется, чем является обнаруженный объект устройство или сервис.
Состояние обнаружения = Доступен – Событие обнаружения узла сети или сервиса соответствует Доступен.
Недоступен – Событие обнаружения узла сети или сервиса соответствует Недоступен.
Обнаружен – Событие обнаружения узла сети или сервиса соответствует Обнаружен
Потерян – Событие обнаружения узла сети или сервиса соответствует Потерян
Доступен/Недоступен =
=
Продолжительность недоступности для событий недоступности узла сети или сервиса. Продолжительность доступности для событий доступности узла сети или сервиса.
= доступен/недоступен равно или более чем
= доступен/недоступен равно или менее чем. Параметр указывается в секундах.
Полученное значение =

=
=
не содержит
содержит

Сравнение с полученным значением от агента (Zabbix, SNMP). Сравнение строки.
= равняется значению
не равняется значению
= равно или более чем значение
= равно или менее чем значение
содержит – содержит как подстроку
не содержит – не содержит как подстроку. Параметр задается строковым значением.
Прокси = Проверяется под управлением какого Zabbix прокси обнаружен узел сети.
= соответствует указанному прокси-серверу
не соответствует указанному прокси-серверу.

Следующие условия действий могут быть определены для событий, возникающих при Авторегистрации:

Тип условия Поддерживаемые операнды Описание
Имя узла сети содержит
не содержит
Проверяется содержит ли обнаруженное устройство в имени узла сети указанный текст.
содержит узел сети содержит указанную информацию в имени узла сети
не содержит узел сети не содержит указанную информацию в имени узла сети.
Прокси = Проверяется под управлением какого Zabbix прокси обнаружен объект..
= соответствует указанному прокси-серверу
не соответствует указанному прокси-серверу.

Для примера рассмотрим следующий набор условий (тип вычисления: AND/OR):

будет вычисляться так:

(Группа узлов сети = Oracle servers или
Группа узлов сети = MySQL servers) и
(Имя триггера содержит 'Database is down' или
Имя триггера содержит 'Database is unavailable')

Операции

Операции или набор операций выполняются если событие соответствует условиям.

Zabbix поддерживает следующие операции:

Дополнительные операции доступны для событий обнаружения:

При добавлении узла сети, его имя будет получено (разрешено) с помощью стандартной функции gethostbyname. Если имя узла сети разрешается, тогда используется полученое имя. Если нет, тогда используется IP адрес. Кроме того, если IPv6 адрес используется для имени узла сети, тогда все ”:” (двоеточия) заменяются на “_” (подчеркивание), потому что ”:” (двоеточия) не разрешены в имени узлов сети.

Параметр Описание
Шаг Если включена эскалация для этого действия, тогда доступны следующие параметры:
От выполнять на каждом шагу начиная с первого
К до этого (0, для всех шагов начиная с От)
Период переход к следующему шагу после заданного периода, 0 использовать период по умолчанию.
Тип операции Тип действия:
Отправить сообщение отправка сообщения пользователю
Удаленная команда выполнить удаленную команду
Источник события
Отправить сообщение Отправить сообщение:
Одному пользователь одному пользователю
Группе пользователей всем членам группы пользователей
Сообщение по умолчанию Если выбрано, то будет использоваться сообщение по умолчанию.
Отправлять только Выбор какое из возможных средств передачи использовать для отправки сообщения (Все средства передачи или конкретное).
Тема Тема сообщения. Тема может содержать макросы.
Сообщение Непосредственно сообщение. Сообщение может содержать макросы.
Удаленная команда Список удаленных команд.
Условия Используется при эскалированном действии на сработавший триггер. Может принимать значения для подтвержденного события на триггер “Не подтверждено” или “Подтверждено”

Макросы для сообщений и удаленные команды

Макросы могут быть использованы для более эффективного оповещения.

Пример 1

Тема реального сообщения будет заменена на нечто вроде:

Пример 2

Реальное сообщение будет заменено на нечто вроде:

Пример 3

Реальное сообщение будет заменено на нечто вроде:

2 Макросы

Zabbix поддерживает некоторое количество макросов, которые могут быть использованы в различных ситуациях. Эффективное использование макросов позволяет сократить время и сделать настройку Zabbix более прозрачной.

Список поддерживаемых макросов

В таблице содержится полный список поддерживаемых макросов Zabbix. X обозначает “поддерживается”.

Имена элементов данных Описание
Имена триггеров ▼▼
Выражения триггеров ▼▼
Подписи на картах 1 ▼▼
Параметры ключей элементов данных ▼▼
GUI скрипты ▼▼
Оповещения авторегистрации ▼▼
Оповещения обнаружения ▼▼
Оповещения и команды ▼▼
МАКРОС ▼▼
­ ▼▼ 1 2 3 4 5 6 7 8 9
X X X Текущая дата в формате yyyy.mm.dd.
X IP адрес обнаруженного устройства. Доступно всегда, не зависит от того добавлен узел сети или нет.
X Состояние обнаруженного устройства: может быть ДОСТУПЕН или НЕДОСТУПЕН.
X Время с момента последнего изменения состояния обнаружения для конкретного устройства.
Например: 1ч 29м.
Для устройств с состоянием НЕДОСТУПЕН этот период указывает время недоступности.
X Название правила обнаружения, которое обнаружило наличие или отсутствие устройства или сервиса.
X Имя сервиса, которое было обнаружено.
Например: HTTP .
X Порт на котором сервис был обнаружен.
Например: 80.
X Состояние сервиса правила обнаружения: может быть ДОСТУПЕН или НЕДОСТУПЕН.
X Время с момента последнего изменения состояния обнаружения для конкретного сервиса.
Например: 1ч 29м.
Для сервисов с состоянием НЕДОСТУПЕН этот период указывает время недоступности.
X История эскалаций. Журнал предыдущих отправленных сообщений. Отображает предыдущие отправленные оповещения, на котором шаге эскалации они были отправлены и их статус (отправлено, в процессе и ошибка).
X
X
X X X Возраст события. Полезно в сообщениях эскалации.
X X X Дата события.
X X X Код (ID) события, вызвавшего это действие.
X X X Время события.
X X X X X Имя узла сети N-го элемента данных из триггера вызвавшего это оповещение. Поддерживается в оповещениях авторегистрации начиная с версии 1.8.4.
X X X X IP или DNS имя узла сети, зависимо от его настроек.
X X X X DNS имя узла сети.
1 2 3 4 5 6 7 8 9
X X X X IP адрес N-го элемента данных триггера вызвавшего это оповещение.
X Числовой ID N-го элемента данных триггера вызвавшего это оповещение. Поддерживается начиная с 1.8.12.
X X Последнее значение элемента данных N-го элемента данных в выражении триггера вызвавшего это оповещение. Поддерживается начиная с 1.4.3. Это алиас для <:.last(0)>
X
X
X
X
X
X
X
X Имя N-го элемента данных в выражении триггера, вызвавшего это оповещение.
X X Последнее значение N-го элемента данных в выражении триггера, если используется для отображения триггеров.
Историческое значение (точно когда произошло событие) N-го элемента данных из выражения триггера, если используется для отображения событий и оповещений. Поддерживается начиная с Zabbix 1.4.3.
X X X ID ноды
X X X Имя ноды
X Контакт из профиля узла сети.
X Тип устройства из профиля узла сети.
X Аппаратное обеспечение из профиля узла сети.
X Размещение устройства из профиля узла сети.
1 2 3 4 5 6 7 8 9
X MAC адрес из профиля узла сети.
X Имя из профиля узла сети.
X Заметки из профиля узла сети.
X ОС из профиля узла сети.
X Серийный номер из профиля узла сети.
X Программное обеспечение из профиля узла сети.
X Метка из профиля узла сети.
X X X Имя прокси N-го триггера вызвавшего оповещение. Поддерживается начиная с версии 1.8.4.
X Алиас для .
X X X Текущее время в формате чч:мм.сс.
X Комментарий к триггеру.
X X Количество неподтвержденных событий для элемента на картах сетей или для триггера, вызвавшего текущее событие в уведомлениях. Поддерживается в подписях к элементам карт начиная с версии 1.8.3.
X X Количество неподтвержденных событий ПРОБЛЕМА для всех триггеров изменивших свое состояние, без учета их состояния. Поддерживается начиная с версии 1.8.3.
X Количество неподтвержденных событий ПРОБЛЕМА для триггеров в состоянии ПРОБЛЕМА. Поддерживается начиная с 1.8.3.
X X Количество подтвержденных событий для элемента на картах сетей, или для триггера вызвавшего текущее событие в уведомлениях. Поддерживается начиная с 1.8.3.
X X Количество подтвержденных событий ПРОБЛЕМА для всех триггеров, без учета их состояния. Поддерживается начиная с 1.8.3.
X Количество подтвержденных событий ПРОБЛЕМА для триггеров в состоянии ПРОБЛЕМА. Поддерживается начиная с 1.8.3.
1 2 3 4 5 6 7 8 9
X Выражение триггера. Поддерживается начиная с 1.8.12.
X Код (ID) триггера вызвавшего это действие.
X Ключ N-го элемента данных в выражении триггера, вызвавшего это действие.
X Имя (описание) триггера.
X Числовое представление важности триггера. Возможные значения: 0 Не классифицировано, 1 Информация, 2 Предупреждение,3 Средняя, 4 Высокая, 5 Чрезвычайная, Поддерживается начиная с Zabbix 1.6.2.
X Важность триггера. Возможные значения: Not classified, Information, Warning, Average, High, Disaster, Unknown
X Состояние триггера. Может быть ПРОБЛЕМА или ОК. устарел.
X URL триггера.
X X Текущее значение триггера: 0 если триггер в состоянии ОК, 1 – если триггер в состоянии ПРОБЛЕМА, 2 – если триггер в состоянии НЕИЗВЕСТНО. Этот макрос может быть использован в выражениях триггеров.
X Количество неподтвержденных триггеров для элемента на картах сетей, без учета состояния триггера. Триггер считается не подтвержденным, если хотя бы одно его событие ПРОБЛЕМА не подтверждено. Поддерживается начиная 1.8.3.
X Количество неподтвержденных триггеров в состоянии ПРОБЛЕМА для элемента на картах сетей. Поддерживается начиная с версии 1.8.3.
X Количество подтвержденных триггеров для элемента на картах сетей, без учета состояния триггера. Триггер считается не подтвержденным, если все его события ПРОБЛЕМА подтверждены. Поддерживается начиная 1.8.3.
X Количество подтвержденных триггеров ПРОБЛЕМА для элемента на картах сетей. Триггер считается подтвержденным, если все его события ПРОБЛЕМА подтверждены. Поддерживается начиная с 1.8.3.
X X 2 X Простой макрос используется в выражении триггера.
X X X X Пользовательские макросы. Поддерживается в именах триггеров и в описаниях элементов данных начиная с версии 1.8.4.
1 2 3 4 5 6 7 8 9
[2]В подписях на карте сети поддерживаются только функции last, avg, max и min с секундами в качестве аргумента.

Пользовательские макросы

Для большей гибкости, Zabbix поддерживает пользовательские макросы, которые могут быть определены на глобальном уровне, на уровне шаблонов и на уровне узлов сети. Эти макросы имеют специальный синтаксис: . Макросы могут быть использованы в ключах элементов данных и в выражениях триггеров. Начиная с Zabbix версии 1.8.4 пользовательские макросы так же возможно использовать в описаниях элементов данных и в именах триггеров.

Следующие символы допустимы в именах макросов: A-Z , 0-9 , _ , .

Zabbix замещает макросы в соответствии со следующей очередностью:

Иными словами, если макрос не существует для узла сети непосредственно, тогда Zabbix попытается найти его в шаблонах, присоединенных к узлу сети, с учетом уровня глубины шаблонов. Если макрос все еще не найден, тогда будет использоваться макрос глобального уровня, если он существует конечно.

В случае, если Zabbix не удалось найти макрос, макрос не будет заменен на значение.

Для определения пользовательского макроса, перейдите в соответствующие разделы в веб-интерфейсе:

Наиболее общие случаи использования глобальных макросов и макросов уровня узлов сети:

Пример 1

Использование макроса в ключе элемента данных “Status of SSH daemon”:

Пример 2

Использование макроса уровня узла сети в триггере “CPU load is too high”:

Пример 3

Использование двух макросов в триггере “CPU load is too high”:

Заметьте, что макрос может быть использован в качестве параметра для функции триггера, в этом примере для функции min().

3 Группы элементов данных

Группа элементов данных представляет собой набор элементов данных для узла сети. Например, группа элементов данных ‘MySQL Server’ может содержать все элементы данных, которые относятся к серверу MySQL: доступность MySQL, размер на диске, загруженность процессора, количество операций в секунду, количество медленных запросов и т.д.

Элемент данных может быть связан с одним или несколькими группами элементов данных.

Группы элементов данных используются в веб-интерфейсе Zabbix для группировки элементов данных.

4 Графики

Пользовательские графики позволяют создавать сложные (состоящие из нескольких элементов данных) графики.

Такие графики, однажды настроенные, потом можно легко использовать через меню Мониторинг→Графики.

Настройку пользовательских графиков можно легко осуществить перейдя в Настройка→Шаблоны или Настройка→Узлы сети и нажав на ссылку Графики у соответствующего шаблона или узла сети.

1. если первый элемент данных был выбран из шаблона, тогда только из этого шаблона;

2. если первый элемент данных был выбран из любого узла сети, тогда из любого узла сети (но уже не из шаблонов)

5 Способы оповещений

Способы оповещений являются каналами передачи оповещений от Zabbix сервера. Один или более способов оповещений могут быть назначены одному пользователю.

Email

Оповещения по электронной почте.

Jabber

Оповещение, используя сообщения Jabber.

При отправке оповещений, Zabbix попытается найти первую запись SRV Jabber, и если не удалось найти, тогда будет использоваться адрес записи этого домена. Среди записей SRV Jabber, будет выбрана одна с наивысшим приоритетом и с максимальным весом. Если не удалось найти такую запис, другие записи проверяться не будут.

Обзор записей SRC Jabber поддерживается начиная с Zabbix 1.8.6. До этой версии Zabbix пытался найти только запись адреса.

Скрипты

Пользовательские медиа скрипты выполняются из пути указанного в конфигурационном файле Zabbix сервера в переменной AlertScriptsPath. Скрипт должен иметь три параметра коммандной строки, получаемые в порядке:

Переменные среды не сохраняются или создаются для скрипта, поэтому они должны быть обработаны в явном виде.

GSM модем

Zabbix поддерживают отправку СМС сообщений, используя GSM-модем, подключенный к последовательному порту Zabbix сервера.

Zabbix был протестирован на следующих модемах GSM:

6 Шаблоны узлов сети

Использование шаблонов это отличный способ сделать управление системой Zabbix более простой.

Шаблон может быть присоединен к любому количеству узлов сети. Элементы данных, триггеры и графики шаблона будут автоматически добавлены к связанному узлу сети. Измените любые элементы шаблона (элементы данных, триггер, графики) и изменения будут автоматически применены к узлам сети, связанным с этим шаблоном .

Атрибуты шаблона узла сети:

Параметр Описание
Имя Уникальное имя шаблона (узла сети). Имя должно быть уникальным в пределах каждой Zabbix ноды.
Группы Список групп узлов сети, к которым шаблон принадлежит.
Новая группа Назначение шаблону новой группы узлов сети.
Узлы сети|Шаблоны Связывание шаблона с указанными узлами сети или другими шаблонами.
Соединить с шаблоном Используется для создания иерархии шаблонов.
Макрос Использование макросов на уровне шаблонов.

7 Группы узлов сети

Группа узлов сети может содержать один, несколько улов сети или не содержать их вообще.

Атрибуты групп узлов сети:

Параметр Описание
Название группы Уникальное имя группы узлов сети. Имя должно быть уникальным в пределах Zabbix ноды.
Узлы сети Список узлов сети включенных в эту группу.

8 Узлы сети и зависимости триггеров

Zabbix не поддерживает зависимостей для узлов сети. Зависимости для узлов сети могут быть заданы с использованием более гибкого способа зависимостей триггеров.

Как это работает?

Триггер может иметь список из одного или более зависимых триггеров. Это означает, что триггер будет все же менять свое состояние независимо от состояния триггеров в списке, но триггер не будет генерировать оповещения и действия в случае, если один из триггеров в списке находится в состоянии ПРОБЛЕМА .

Пример 1

Зависимость узла сети

Предположим, у вас есть два узла сети: маршрутизатор и сервер. Сервер находится за маршрутизатором. Таким образом, мы хотим получать только одно уведомление, если маршрутизатор недоступен:

“The router is down”

“The router is down” и “The host is down”

Для того чтобы добиться этого, мы создаем зависимость у триггера:

В случае, если сервер и маршрутизатор будут недоступны, Zabbix не будет выполнять действия для триггера “The host is down”.

19 Элементы данных

Элемент данных это одиночная проверка (метрика) производительности или доступности.

1 Ключ элемента данных

1.1 Гибкие и не гибкие параметры

Параметр является гибким, если он может принимать аргументы. Например, параметр vfs.fs.size[*] является гибким. * означает любую строку, которая будет передана в как аргумент параметру. Примеры правильных определений:

1.2 Формат ключа

Следуйте правилам синтаксиса в формате ключа элемента данных, включая параметры ключа. На рисунках изображен поддерживаемый синтаксис. Допустимые элементы и символы в каждой позиции можно определить следуя линиям если в каком то блоке может быть достигнута линия, в таком случае разрешено, если линия не может быть достигнута тогда не разрешено.

Ключ элемента данных

Для построения правильного ключа элемента данных, вы должны начать с указания имени ключа, то есть выбрать имеет ли ключ параметры или нет о чем свидетельствуют две линии, которые вы можете достичь.

Имя ключа

Имя ключа имеет ограниченный диапазон разрешенных символов, которые просто следуют друг за другом. Разрешенные символы:

Параметры ключа

Ключ элемента данных может принимать множество параметров, которые должны быть разделены запятой.

Индивидуальный параметр ключа

Каждый параметр ключа может быть одним из: строка заключенная в кавычки, строка без кавычек, массив.

Параметр можно оставить пустым и тогда будет использоваться значение по умолчанию. В этом случае Вы должны добавить соответствующее количество запятых, если какой-то из дальнейших параметров все же нужно задать. Например, ключ элемента данных icmpping[,,200,,500] будет указывать на то, что период проверки ping 200 миллисекунд, таймаут 500 миллисекунд, а все остальные параметры будут заполнены значениями по умолчанию.

Параметр строка заключенная в кавычки

Если параметр ключа это строка, заключенная в кавычки, тогда разрешен любой символ в Юникоде, и если требуется включение двойных кавычек, то они должны быть экранированы обратной наклонной чертой.

Параметр строка не заключенная в кавычки

Если параметр ключа это строка без кавычек, тогда разрешен любой символ в Юникоде, за исключением запятой и правой квадратной скобки (]).

Параметр массив

Если параметр ключа это массив, тогда он должен быть заключен в квадратные скобки, в которых каждый индивидуальный параметр следует один за другим, согласно правилам и синтаксису.

1.3 Доступные кодировки

Параметр “кодировка” используется для задания специфичной кодировки для обработки элементов данных, так что полученные данные не будут повреждены. Для получения списка поддерживаемых кодировок (идентификаторы кодовых страниц), пожалуйста, обратитесь к соответствующей документации, таких документаций как libiconv (GNU Project) или Microsoft Windows SDK “Идентификаторы кодовых страниц”. Если параметр “кодировка” не задан, тогда используется ANSI по умолчанию с определенным расширением в системе (Windows) или UTF-8 (локаль по умолчанию для новых дистрибутивов Unix/Linux, смотрите настройки вашей системы).

2 Не поддерживаемые элементы данных

Элемент данных может перейти в состояние “не поддерживается”, если по какой либо причине его значение получить не удалось. Такие элементы данных проверяются повторно через интервал времени, который настраивается в разделе Администрирования.

3 Поддержка по платформам

Если элемент данных обозначен символом “X” тогда он поддерживается, если другим символом ”-” тогда не поддерживается.
Если элемент обозначен символом ”?”, значит неизвестно поддерживается он или нет.
Если элемент обозначен символом “r”, значит он требует root привилегий.
Если элемент обозначен символом “i”, значит он игнорируется.

4 Zabbix агент

Список поддерживаемых параметров

Ключ
Описание Возвращаемое
значение
Параметры Комментарии
agent.hostname
Возвращает имя хоста агента. Строка Возвращает действительное значение hostname агента из файла конфигурации.
Этот элемент данных поддерживается начиная с версии 1.8.13.
agent.ping
Проверка доступности агента. Возвращает ‘1’, если доступен и ничего не возвращает, если недоступен. Может быть использовано как TCP ping. Используйте функцию nodata() для проверки недоступности хоста.
agent.version
Версия Zabbix агента. Строка Пример возвращаемого значения: 1.8.2
kernel.maxfiles
Максимальное количество открытых файлов поддерживаемое ОС. Количество файлов. Целочисленное.
kernel.maxproc
Максимальное количество процессов поддерживаемое ОС. Количество процессов. Целочисленное.
log[файл,regexp,кодировка,макс кол-во строк]
Мониторинг файлов журналов (логов). Журнал файл – полное имя файла
regexp – регулярное выражение для шаблона
кодировка Идентификатор кодовой страницы
максимальное количество строк Максимальное количество новых строк в секунду, которое может отправить агент Zabbix серверу или Прокси. Этот параметр заменяет опцию &#039;MaxLinesPerSecond&#039; в zabbix_agentd.conf
Должен быть настроен как Активная проверка.
Например:
log[/home/zabbix/logs/logfile. 100]
Более подробную информацию смотрите здесь
logrt[имя файла в формате,regexp,кодировка,макс кол-во строк]
Мониторинг файлов журналов (логов) с поддержкой ротации логов. Журнал имя файла в формате – имя файла в формате [абсолютный путь][имя файла в формате регулярного выражения]
regexp – регулярное выражения для шаблона
кодировка Идентификатор кодовой страницы
максимальное количество строк Максимальное количество новых строк в секунду, которое может отправить агент Zabbix серверу или Прокси. Этот параметр заменяет опцию &#039;MaxLinesPerSecond&#039; в zabbix_agentd.conf
Должен быть настроен как Активная проверка.
Например:
logrt[“\home\zabbix\logs\^logfile[0-9]<1,3>$”. 100]
Ротация логов базируется на времени последнего изменения файлов.
Более подробную информацию смотрите здесь
eventlog[имя,regexp,важность,источник,eventid,макс. кол-во строк]
Мониторинг журналов событий. Log. имя – имя журнала событий
regexp – регулярное выражение
важность – важность события
Параметр может принимать следующие значения: “Information”, “Warning”, “Error”, “Failure Audit”, “Success Audit”
источник Имя источника
eventid регулярное выражение
максимальное количество строк Максимальное количество новых строк в секунду, которое агент может отправить Zabbix Серверу или Прокси. Этот параметр заменяет опцию &#039;MaxLinesPerSecond&#039; в zabbix_agentd.conf
Должен быть настроен как Активная проверка.
Например:
eventlog[Application]

Тип записи SRV поддерживается Zabbix агентом начиная с версии 1.8.6.

Пример возвращаемого значения
www.zabbix.com

Параметр тип со значениями ops, bps и sps лимитирован 8 устройствами на поддерживаемых платформах (7 устройств +1 для “all” устройств).

Поддерживается LVM начиная с Zabbix 1.8.6.

Параметр тип со значениями ops, bps и sps лимитирован 8 устройствами на поддерживаемых платформах (7 устройств +1 для “all” устройств).

Поддерживается LVM начиная с Zabbix 1.8.6.

Смотрите этот раздел для понимания различий между элементами данных в пассивном и активном режиме.

В некоторых случаях возвращаемые значения следует рассматривать как относительные значения (изменяемые во времени), но не как абсолютные значения.

5 Параметры специфичные для WIN32

Этот раздел содержит описания параметров поддерживаемых только агентами Zabbix WIN32.

Ключ
Описание Возвращаемое значение Комментарии
perf_counter[счетчик,интервал]
Значение любого счетчика производительности, где в качестве “счетчика” передается путь к счетчику и “интервал” временной период для хранения среднего значения. Среднее значение “счетчика” за последние “интервал” секунд. Значение по умолчанию, если не задано, для “интервал” 1. Мониторинг производительности может быть использован для получения списка счетчиков. До версии 1.6 этот параметр может вернуть правильное значение только для счетчиков, которые возвращают только одно значение (например \System\Threads). Параметр не будет работать со счетчиками, которые возвращают более одного значения например утилизация ЦПУ. Начиная с версии 1.6 используется интервал, такая проверка каждый раз возвращает среднее значение за последние “интервал” секунд.
service_state[*]
Состояние сервиса. В качестве параметра имя сервиса. 0 – запущен
1 – пауза
2 ожидание старта
3 ожидание паузы
4 ожидание продолжения
5 ожидание остановки
6 – остановлен
7 неизвестно
255 – такой сервис не существует
Параметр должен передавать реальное имя сервиса, такое как в свойствах сервиса в строке “Имя:” или имя EXE файла.
services[тип,состояние,исключение]
Список сервисов, разделенных новой строкой или 0, если список пустой. тип один из: all (по умолчанию), automatic, manual, disabled
состояние один из: all (по умолчанию), stopped, started, start_pending, stop_pending, running, continue_pending, pause_pending, paused
исключение список служб, исключенных из результата.
Исключение сервисов должно быть записано в двойных кавычках и без пробелов.
Этот параметр поддерживается начиная с версии 1.8.1.
Например:
services[,started] список запущенных процессов
services[automatic, stopped] список остановленных процессов, которые должны быть запущены
services[automatic, stopped, “service1,service2,service3”] -список остановленных сервисов, которые должны быть запущены, исключая сервисы с именами service1,service2 и service3
proc_info[процесс,атрибут,тип]
Различная информация о указанном процессе(ах). процесс имя процесса (как и в параметре proc_cnt[])
атрибут запрашиваемый атрибут процесса.
тип тип представления (будет полезно в случае если имеется несколько процессов с одинаковым именем).
Поддерживаются следующие атрибуты:
vmsize Размер виртуальной памяти в Кбайтах
wkset Размер множества процесса (объем физической памяти используемой процессом) в Кбайтах
pf Количество ошибок страницs
ktime Время процесса ядра в миллисекундах
utime Пользовательское время процесса в миллисекундах
io_read_b Количество байт прочитанных за I/O операции
io_read_op Количество операций чтения для процесса
io_write_b Количество байт прочитанных за I/O операции
io_write_op Количество операций записи для процесса
io_other_b Количество байт переданных процессом при операции, кроме операций выполнения чтения и записи
io_other_op Количество операций ввода/вывода при выполнении процесса, кроме операций чтения и записи
gdiobj Количество объектов GDI использованных процессом
userobj Количество объектов типа USER использованных процессом

Допустимые типы:
min минимальное значение среди процессов указанного в параметре
max максимальное значение среди процессов указанного в параметре
avg среднее значение среди процессов указанного в параметре
sum сумма всех значение среди процессов указанного в параметре

6 SNMP агент

Zabbix должен быть сконфигурирован с поддержкой SNMP, для того чтобы была возможность получения данных от SNMP агентов.

Следующие шаги должны быть выполнены для того, чтобы добавить мониторинг по SNMP:

Шаг 1

Создайте узел сети для SNMP устройства.

Введите IP адрес. Выберите состояние узла сети “Не контролируется”. Теперь вы можете использовать узел сети один из SNMP шаблонов (Template_SNMPv1_Device, Template_SNMPv2_Device), который автоматически добавит элементы данных. Однако, шаблон, может быть несовместим с узлом сети.

Шаг 2

Узнайте OID SNMP для элементов данных, которые вы хотите мониторить.

После создания узла сети используйте приложение &#039;snmpwalk&#039; (часть пакета ucd-snmp/net-snmp, который должен быть установлен как часть Zabbix) или эквивалентную утилиту:

Эта команда вернет вам список строк SNMP и их последнее значение. Если команда не работает, то вполне возможно, что &#039;community&#039; SNMP отличается от стандартного public, в этом случае вам необходимо узнать какое community у вас используется. Затем вы должны пройтись по списку, пока не найдете строку, которую вы хотите мониторить, например, Вы хотели, чтобы наблюдать за количеством входящих байт на 3 порту вашего коммутатора:

Теперь Вы должны использовать команду snmpget, чтобы найти OID для interfaces.ifTable.ifEntry.ifInOctets.3:

где последняя цифра в строке номер порта, который вы хотите мониторить. Команда должна вернуть что-то вроде:

опять последняя цифра в OID это номер порта.

3COM кажется использует номера портов в сотнях, т.е. порт 1=порту 101, порт 3=порту 103, но Cisco использует обычные номера, т.е. порт 3=3.

Шаг 3

Создание элемента данных для мониторинга.

Итак, теперь вернитесь в Zabbix и выберите элементы данных, выбрав SNMP узел сети созданный ранее. В зависимости от того, использовали ли вы или нет шаблоны при создании узла сети, вы увидите список элементов данных SNMP, связанных с вашим узлом сети или просто окно нового элемента данных. Предположим, что вы собираетесь создать элемент данных самостоятельно с помощью информации, которую вы только что собрали с помощью snmpwalk и snmpget, теперь введите описание на английском (или родном) языке в поле &#039;Имя&#039; в окне нового элемента данных. Убедитесь, что в поле &#039;Узел сети&#039; указан ваш коммутатор/маршрутизатор и измените поле “Тип” на “SNMPv1 агент”. Введите community (как правило public) и введите числовой OID, который вы получили ранее, в поле &#039;SNMP OID&#039;. Не забудьте начать с точки, т.е. .1.3.6.1.2.1.2.2.1.10.3

Заполните &#039;Порт SNMP&#039; значением 161 и &#039;Ключ&#039; любой интуитивно понятной записью, например SNMP-InOctets-BPS. Выберите множитель, если требуется, и заполните &#039;Интервал обновления&#039; и &#039;Сохранять историю&#039;, если вы хотите, чтобы эти параметры отличались от стандартных. Выставьте &#039;Состояние&#039; в Активирован, &#039;Тип информации&#039; в Числовой с плавающей точкой и &#039;Хранить значение&#039; в Дельта (что важно, ибо в противном случае вы получите кумулятивные значения от SNMP устройства вместо последних изменений).

Теперь сохраните элемент данных и вернитесь назад к узлам сети в Zabbix. Здесь установите состояние SNMP устройства “Контролируется” и перейдите в меню Мониторинг→Последние данные, здесь вы можете увидеть собранные данные по только что созданному элементу данных!

Пример 1
Параметр Описание
Community public
OID 1.2.3.45.6.7.8.0 (или .1.2.3.45.6.7.8.0)
Ключ Униальная строка, которая будет использована как ссылка в триггерах
Например, ‘my_param’.

Обратите внимание, что OID может быть задан или в числовом, или строковом представлении. Однако в некоторых случаях, OID строки должны быть преобразованы в числовое представление. Для этих целей может быть использована утилита snmpget:

Пример 2
Параметр Описание
Community public
Oid MIB::sysUpTime.0
Ключ router.uptime
Тип значения числовое с плавающей точкой
Единица измерения uptime
Множитель 0.01

7 Простые проверки

Простая проверка обычно используются для мониторинга без использования Агента или для проверки удаленных сервисов. Обратите внимание, что Zabbix агент не является необходимым для простой проверки. За обработку простых проверок отвечает Zabbix сервер (осуществление внешних подключений и т.д.).

Все простые проверки могут принимать один необязательный параметр:

Примеры использования простых проверок:

Список поддерживаемых простых проверок:

Ключ
Описание Возвращаемое значение
ftp,port
Проверяется запущен ли FTP сервер и принимает ли подключения 0 – FTP сервер недоступен
1 – FTP сервер запущен
ftp_perf,port
Проверяется запущен ли FTP сервер и принимает ли подключения 0 – FTP сервер недоступен
В противном случае возвращает количество миллисекунд времени попытки подключения к серверу FTP .
http,port
Проверяется запущен ли HTTP сервер и принимает ли подключения 0 – HTTP сервер недоступен
1 – HTTP сервер запущен
http_perf,port
Проверяется запущен ли HTTP (WEB) сервер и принимает ли подключения 0 – HTTP (WEB) сервер недоступен
В противном случае возвращает количество миллисекунд времени попытки подключения к серверу HTTP (WEB).
icmpping[цель,пакеты,интервал,размер,таймаут]
Проверяется доступен ли сервер по ICMP ping
цель IP адрес или DNS имя узла сети
пакеты количество пакетов
интервал время между успешными пакетами в миллисекундах
размер размер пакета в байтах
таймаут время ожидания в миллисекундах
0 – не удалось ICMP ping
1 – успешно ICMP ping
icmppingloss[цель,пакеты,интервал,размер,таймаут]
Возвращает процент потерянных пакетов
цель IP адрес или DNS имя узла сети
пакеты количество пакетов
интервал время между успешными пакетами в миллисекундах
размер размер пакета в байтах
таймаут время ожидания в миллисекундах
Потери пакетов в процентном отношении
icmppingsec[цель,пакеты,интервал,размер,таймаут,режим]
Возвращает время ответа на ICMP ping
цель IP адрес или DNS имя узла сети
пакеты количество пакетов
интервал время между успешными пакетами в миллисекундах
размер размер пакета в байтах
таймаут время ожидания в миллисекундах
режим один из min, max, avg (по умолчанию)
Количество секунд
imap,port
Проверяется запущен ли IMAP сервер и принимает ли подключения 0 – IMAP сервер недоступен
1 – IMAP сервер запущен
imap_perf,port
Проверяется запущен ли IMAP сервер и принимает ли подключения 0 – IMAP сервер недоступен
В противном случае возвращает количество секунд времени попытки подключения к серверу IMAP .
ldap,port
Проверяется запущен ли LDAP сервер и принимает ли подключения 0 – LDAP сервер недоступен
1 – LDAP сервер запущен
ldap_perf,port
Проверяется запущен ли LDAP сервер и принимает ли подключения 0 – LDAP сервер недоступен\В противном случае возвращает количество секунд времени попытки подключения к серверу LDAP .
nntp,port
Проверяется запущен ли NNTP сервер и принимает ли подключения 0 – NNTP сервер недоступен
1 – NNTP сервер запущен
nntp_perf,port
Проверяется запущен ли NNTP сервер и принимает ли подключения 0 – NNTP сервер недоступен\В противном случае возвращает количество секунд времени попытки подключения к серверу NNTP.
ntp,port
Проверяется запущен ли NTP сервер и принимает ли подключения 0 – NTP сервер недоступен
1 – NTP сервер запущен
ntp_perf,port
Проверяется запущен ли NTP сервер и принимает ли подключения 0 – NTP сервер недоступен\В противном случае возвращает количество секунд времени попытки подключения к серверу NTP.
pop,port
Проверяется запущен ли POP сервер и принимает ли подключения 0 – POP сервер недоступен
1 – POP сервер запущен
pop_perf,port
Проверяется запущен ли POP сервер и принимает ли подключения 0 – POP сервер недоступен
В противном случае возвращает количество секунд времени попытки подключения к серверу POP .
smtp,port
Проверяется запущен ли SMTP сервер и принимает ли подключения 0 – SMTP сервер недоступен
1 – SMTP сервер запущен
smtp_perf,port
Проверяется запущен ли SMTP сервер и принимает ли подключения 0 – SMTP сервер недоступен
В противном случае возвращает количество секунд времени попытки подключения к серверу SMTP .
ssh,port
Проверяется запущен ли SSH сервер и принимает ли подключения 0 – SSH сервер недоступен
1 – SSH сервер запущен
ssh_perf,port
Проверяется запущен ли SSH сервер и принимает ли подключения 0 – SSH сервер недоступен
В противном случае возвращает количество секунд времени попытки подключения к серверу SSH .
tcp,port
Проверяется запущен ли сервис TCP и принимает ли подключения 0 – TCP сервис недоступен
1 – TCP сервис запущен
tcp_perf,port
Проверяется запущен ли сервис TCP и принимает ли подключения 0 – сервис на указанном порту недоступен
В противном случае возвращает количество секунд времени попытки подключения к серверу TCP.
Обработка таймаутов

Zabbix не будет обрабатывать простую проверку дольше чем указано в параметре Таймаут в файле конфигурации Zabbix.

ICMP pings

Zabbix использует внешнюю утилиту fping для обработки ICMP pings. Утилита не распространяется в комплекте с Zabbix и должна быть установлена дополнительно. Если программа отсутствует, имеет неправильные права или её путь не соответствует параметру FpingLocation, указанному в файле конфигурации, ICPM pings (icmpping, icmppingsec и icmppingloss) не будут обработаны.

fping должен быть выполняем под пользователем Zabbix демонов и должен иметь setuid root. Выполните эти команды под пользователем root для настройки правильных полномочий:

Значения по умолчанию параметров для проверок по ICMP:

Параметр Значение Описание Флаг в fping Мин Макс
пакетов 3 количество пакетов до цели -c 1 10000
интервал 25 миллисекунд, по умолчанию в “fping” -p 20
размер 56 или 68 байт, по умолчанию в “fping”; 56 байт для x86, 68 байт для x86_64 -b 24 65507
таймаут 500 миллисекунд, по умолчанию в “fping” -t 50

Zabbix записывает во временный файл адреса для проверки, которые затем будут переданы утилите fping. Если элементы данных имеют разные параметры, то только те которые имеют идентичные параметры записываются в один файл.

8 Внутренние проверки

Внутренняя проверка позволяют контролировать внутреннее состояние Zabbix. Внутренние проверки подсчитываются самим Zabbix сервером.

Ключ
Описание Комментарии
zabbix[boottime]
Время запуска процесса Zabbix сервера в секундах. В секундах, начиная с Эпохи.
zabbix[history]
Количество значений записанных в таблицу HISTORY Не используйте при MySQL InnoDB, Oracle или PostgreSQL
zabbix[history_log]
Количество значений записанных в таблицу HISTORY_LOG Не используйте при MySQL InnoDB, Oracle или PostgreSQL!
Этот элемент данных поддерживается начиная с версии 1.8.3.
zabbix[history_str]
Количество значений записанных в таблицу HISTORY_STR Не используйте при MySQL InnoDB, Oracle или PostgreSQL!
zabbix[history_text]
Количество значений записанных в таблицу HISTORY_TEXT Не используйте при MySQL InnoDB, Oracle или PostgreSQL!
Этот элемент данных поддерживается начиная с версии 1.8.3.
zabbix[history_uint]
Количество значений записанных в таблицу HISTORY_UINT Не используйте при MySQL InnoDB, Oracle или PostgreSQL!
Этот элемент данных поддерживается начиная с версии 1.8.3.
zabbix[trends]
Количество значений записанных в таблицу TRENDS Не используйте при MySQL InnoDB, Oracle или PostgreSQL!
zabbix[trends_uint]
Количество значений записанных в таблицу TRENDS_UINT Не используйте при MySQL InnoDB, Oracle или PostgreSQL!
Этот элемент данных поддерживается начиная с версии 1.8.3.
zabbix[items]
Количество элементов данных в базе данных Zabbix
zabbix[items_unsupported]
Количество не поддерживаемых элементов данных в базе данных Zabbix
zabbix[triggers]
Количество триггеров в базе данных Zabbix.
zabbix[log]
Сохраняет сообщения предупреждений и ошибок генерируемых Zabbix сервером. Тип символьный. Добавьте этот элемент данных, чтобы записывать внутренние сообщения Zabbix.
zabbix[process,тип,режим,состояние]
Время конкретного процесса Zabbix или группы процессов (указывается через тип и режим), потраченное на состояние в процентах. Расчет производится только за последнюю минуту.

Возможные режимы:
avg среднее значение для всех процессов указанного типа (по умолчанию)
count количество форков указанного типа процесса, состояние не должно быть указано
max максимальное значение
min минимальное значение
process number номер процесса (от 1 до количества префорк процессов). Например, если запущенно 4 траппера, тогда значение от 1 до 4.

Возможные состояния:
busy процесс в занятом состоянии, например, обработка запроса (по умолчанию).
idle процесс в свободном состоянии, ничего не делающий.

Примеры:
zabbix[process,poller,avg,busy] среднее время, потраченное процессами пуллеров, которые что-либо делали за последнюю минуту
zabbix[process,”icmp pinger”,max,busy] максимальное время, потраченное любыми процессами ICMP pinger, которые что-либо делали за последнюю минуту
zabbix[process,trapper,count] общее количество запущенных процессов trapper

9 Агрегированные проверки

Агрегированные проверки не требуют, чтобы агент был запущен на наблюдаемом узле сети. Zabbix сервер собирает агрегированную информацию делая прямые запросы к базе данных.

Синтаксис ключа агрегированного элемента данных

Поддерживаемые параметры функции группы:

Функция группы Описание
grpavg Среднее значение
grpmax Максимальное значение
grpmin Минимальное значение
grpsum Сумма значений

Поддерживаемые параметры элементов данных:

Функция элемента данных Описание
avg Среднее значение
count Количество значений
last Последнее значение
max Максимальное значение
min Минимальное значение
sum Сумма значений

Примеры ключей для агрегированных проверок:

Пример 1

Суммарное значение размера дисков для группы хостов &#039;MySQL Servers&#039;.

Пример 2

Средняя загрузка процессора для группы узлов сети &#039;MySQL Servers&#039;.

Пример 3

Среднее (5мин) количество запросов в секунду для группы узлов сети &#039;MySQL Servers&#039;

10 Внешние проверки

Внешние проверки это проверки выполняемые Zabbix сервером путем выполнения скрипта или бинарного файла.

Внешняя проверка не требует никакого запущенного агента на наблюдаемом узле сети.

Синтаксис ключа элемента данных:

Если вы не планируете передавать какие либо параметры в скрипт, вы можете использовать следующие записи:

Zabbix сервер найдет и выполнит команду в директории, указанной в параметре ExternalScripts конфигурационного файла zabbix_server.conf. Команда будет выполнена от пользователя под которым работает Zabbix сервер, поэтому необходимые права доступа или переменные окружения должны быть предусмотрены в самом скрипте, если необходимо, и разрешения на команду должны быть даны пользователю для их выполнения. Команды доступны только те, которые размещены в указанной директории.

Zabbix использует первую строку (конечные пробелы удаляются) в стандартный вывод скрипта как значение. Остальные строки, стандартная ошибка и код выхода отбрасываются.

Пример 1

Выполнить скрипт check_oracle.sh с параметрами ”-h 192.168.1.4”. DNS имя хоста &#039;www1.company.com&#039;.

Zabbix будет выполнять:

11 Проверки по SSH

Zabbix должен быть сконфигурирован с поддержкой SSH2.

Ключ Описание Комментарии
ssh.run[уникальное короткое описание,ip,порт,кодировка] Выполняет команду используя SSH сессию

12 Проверки по Telnet

Проверки по Telnet используются для безагентного мониторинга. Zabbix агент не требуется для проверок через Telnet.

Актуальные команды для выполнения должны быть помещены в поле Выполняемый скрипт в настройках элемента данных. Несколько команд могут быть выполнены одна за другой, разместив их каждую в новой строке.

До версии 1.8.1, поддерживаются строковые символы, которые могут заканчиваться на:

В версии 1.8.2 добавлено поддержку дополнительного символа:

Ключ Описание Комментарии
telnet.run[уникальное короткое описание,ip,порт,кодировка] Выполнение команды на удаленном устройстве используя telnet соединение

13 Вычисляемые элементы данных

С вычисляемыми элементами данных вы можете создавать вычисления на основе других элементов данных. Таким образом, вычисляемые элементы данных используются для создания виртуальных источников данных. Значения элементов данных периодически вычисляются, базируясь на арифметическом выражении.

Результирующие данные будут записаны в базу данных Zabbix, как и для любого другого элемента данных это значит, что сохраняются как значения истории так и тендеций для более быстрого отображения графика. Вычисляемые элементы данных могут быть использованы в выражениях триггеров.

Для использования вычисляемых элементов данных, выберите тип элемента данных Вычисляемый. Ключ является уникальным идентификатором элемента данных (в пределах узла сети). Вы можете создать любое имя ключа, используя допустимые символы. Определение расчета нужно ввести в поле Формула (называется Выражение в версиях 1.8.1 и 1.8.2). Не существует практически никакой взаимосвязи между формулой и ключем. Параметры ключа никаким образом не используются в формуле переменные могут быть переданы в формулу с помощью пользовательских макросов.

Корректный синтаксис для простой формулы имеет вид:

Аргумент Определение
func Одна из функций, поддерживаемых выражениями триггеров: last, min, max, avg, count и др.
узел сети:ключ Ключ другого элемента данных, данные которого вы хотите использовать. Может быть определен как ключ или имя_хоста:ключ.
Примечание: Заключение всего ключа в двойные кавычки (”…”) настоятельно рекомендуется во избежании неправильного разбора пробелов или разделителей в ключе.
Так же если в ключе имеются двойные кавычки, то кавычки должныть быть экранированы бэкслешем (\). Смотрите Примеры 5 и 6 ниже.
параметр(ы) Любые дополнительные параметры, которые могут потребоваться. Смотрите Пример 5 ниже.

Поддерживаемые символы для имени узла сети:

Поддерживаемые символы для ключа:

Поддерживаемые символы для функции:

В отличии от выражений триггеров, процесс Zabbix вычисляет элементы данных в соответствии с интервалом обновления, а не при получении нового значения. Также, если вы меняете ключ элемента данных у элемента ссылки, вы должны вручную обновить все формулы, где используется этот элемент данных.

Вычисляемый элемент данных может перейти в состояние не поддерживаемого в нескольких случаях:

Пример 1

Вычисление процентного отношения свободного места на диске в &#039;/&#039;.

Используем функцию last:

Zabbix возьмет последние значения для свободного и всего места на диске, и вычислит процентное отношение по указанной выше формуле.

Пример 2

Вычисление среднего количества значений за 10 минут обработанных Zabbix.

Используем функцию avg:

Следует отметить, что использование вычисляемых элементов данных с большим временным периодом может повлиять на производительность Zabbix сервера.

Пример 3

Вычисление полной пропускной способности на интерфейсе eth0.

Сумма двух функций:

Пример 4

Вычисление процента входящего трафика.

Другое сложное выражение:

Пример 5

Вычисление количества записей в файле журнала за последние 10 минут.

Примите к сведению, то как двойные кавычки экранируются внутри ключа и первого параметра функции, если требуется:

Пример 6

Возможно использование аггрегированных элементов данных в вычисляемых элементах данных.

Примите к сведению, то как экранируются двойные кавычки внутри заключенного в кавычки ключа:

10 Пользовательские параметры

Функциональность Zabbix агентов может быть расширена путем добавления пользовательских параметров (параметр конфигурации UserParameter) в файле конфигурации агента. Как только пользовательские параметры определены они могут быть использованы так же, как и любые другие элементы данных агента по ключу, указанному в параметре.

Пользовательские параметры это команды, которые выполняются Zabbix агентом. В операционных системах UNIX используется интерпретатор командной строки /bin/sh.

Смотрите пошаговое руководство по использованию пользовательских параметров.

1 Простые пользовательские параметры

Для того, чтобы задать новый параметр для мониторинга, должна быть добавлена всего одна строка в файл конфигурации Zabbix агента, после чего агента следует перезапустить.

Пользовательский параметр имеет следующий синтаксис:

Параметр Описание
Ключ Уникальный ключ элемента данных.
Команда Команда, которая будет выполнена для получения значения ключа.
Пример 1

Агент всегда будет возвращать &#039;1&#039; для элемента данных с ключом &#039;ping&#039;.

Пример 2

Более сложный пример

Агент будет возвращать &#039;1&#039; если MySQL сервер доступен, &#039;0&#039; – в противном случае.

2 Гибкие пользовательские параметры

Гибкие пользовательские параметры могут быть использованы для большей управляемости и гибкости.

Гибкий пользовательский параметр:

Параметр Описание
Ключ Уникальный ключ элемента данных. [*] определяет, что ключ может принимать параметры.
Команда Команда, которая будет выполнена для получения значения ключа.
Zabbix агент производит анализ содержимого внутри квадратных скобок [] и заменяет им переменные $1,…,$9 в команде. Переменная $0 будет заменена оригинальной командой (до расширения $0,…,$9) для выполнения.
Пример 1

Очень простой пример

Мы можем создать неограниченное количество элементов данных для наблюдения за чем угодно, указав в таком формате ping[что угодно].

Пример 2

Давайте добавим больше смысла!

Этот параметр может быть использован для мониторинга доступности баз данных MySQL. В качестве параметров мы можем передать имя пользователя и пароль. Ключ элемента данных в таком случае выглядит вот так:

Пример 3

Сколько строк в файле, которые соответствуют регулярному выражению?

Этот параметр может быть использован для подсчета количества строк в файле.

11 Счетчики производительности в Windows

Счетчики производительности в Windows могут быть эффективно контролируемы при использовании perf_counter[].

Для того чтобы получить полный список доступных счетчиков производительности для мониторинга вы можете запустить:

К сожалению, в зависимости от настроек местоположения, именования счетчиков производительности могут быть разными на разных серверах Windows. Это может ввести определенные проблемы при создании шаблонов для Windows, имеющих разные настройки местоположения.

Каждый счетчик производительности может быть переведен в цифровую форму, которая является уникальной и независимой от языковых настроек.

Выполните regedit, затем найдите HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Perflib\009.
Реестр содержит информацию:

Таким образом, для того, чтобы перевести строку имени счетчика производительности в числовую форму,
найдите соответствующие цифры для каждой части счетчика производительности, например:

Затем используйте эти цифры, чтобы создать числовой формат:

1 Простые пользовательские параметры

Для того, чтобы задать новые параметры для мониторинга, должна быть добавлена всего одна строка в файл конфигурации Zabbix агента и агент должен быть перезапущен.

12 Триггеры

Триггеры это логические выражения, которые отображают собой состояние системы.

Триггер может принимать следующие значения:

Значение Описание
ПРОБЛЕМА Обычно означает, что что-то случилось. Например, высокая загрузка процессора. Называлось TRUE в предыдущих версиях Zabbix.
ОК Это нормальное состояние для триггера. Называлось FALSE в предыдущих версиях Zabbix.
НЕИЗВЕСТНО Означает что Zabbix не может высчитать выражение триггера. Это может произойти по нескольким причинам:
сервер недоступен
выражение триггера не может быть высчитано
выражение триггера было недавно изменено

1 Выражения у триггеров

Используемые в триггерах выражения являются очень гибкими. Вы можете использовать их для создания сложных логических тестов, учитывая статистику по мониторингу.

1.1 Операторы выражений

Следующие операторы поддерживаются для триггеров (представлены по убыванию приоритета выполнения):

Приоритет Оператор Определение
1 / Деление
2 * Умножение
3 Арифметический минус
4 + Арифметический плюс
5 Менее чем. Этот оператор может быть представлен в виде:
AB ⇔ (A=B-0.000001)
6 Более чем. Этот оператор может быть представлен в виде:
AB ⇔ (A=B+0.000001)
7 # Не равен. Этот оператор может быть представлен в виде:
A#B ⇔ (A=B-0.000001) | (A=B+0.000001)
8 = Равен. Этот оператор может быть представлен в виде:
A=B ⇔ (AB-0.000001) (AB+0.000001)
9 Логическое И
10 | Логическое ИЛИ

2 Функции триггеров

Функции триггеров позволяют ссылаться на собранные значения, текущее время и другие факторы.

2.1 Функции основанные на времени

Состояние (выражение) триггера пересчитывается каждый раз когда Zabbix сервер получает новое значение данных, если это значение данных является частью выражения. Если в выражении триггера используются функции относящиеся ко времени такой триггер пересчитывается каждые 30 секунд.

Функции относящиеся ко времени:

2.2 Список функций триггеров

Поддерживаются следующие функции:

ФУНКЦИЯ Аргумент(ы) Типы поддерживаемых
значений
Описание
abschange игнорируется float, int, str, text, log
Возвращает абсолютную разницу между последним и предыдущим значениями.
Для строк:
0 значения равны
1 значения различны
avg секунды или #num float, int
Среднее значение за период времени. Параметр определяет продолжительность периода в секундах.
Эта функция принимает секунды, необязательный параметр time_shift. Это бывает полезно, когда нужно сравнить текущее среднее значение со средним значением time_shift секунд ранее. Например, avg(3600,86400) вернет среднее значение за один час одним днем ранее.
Параметр time_shift поддерживается начиная с Zabbix 1.8.2
change игнорируется float, int, str, text, log
Возвращает разницу между последним и предыдущим значениями.
Для строк:
0 значения равны
1 значения различны
count секунды или #num float, int, str, text, log
Количество значений данных из истории за период времени в секундах или количество последних #num значений попадающих под условие.
Функция может принимать второй необязательный параметр шаблон, третий параметр оператор, и четвертый параметр time_shift.
Например,
count(600,12) вернет точное количество значений равных &#039;12&#039; из истории за промежуток времени 10 минут.
Элементы данных с типом Целые числа: точное совпадение
Числа с плавающей запятой: совпадение с точностью до 0.00001
Строки, текст и журналы элементы данных: поддерживаются операторы like (по умолчанию), eq, ne.
Поддерживаемые операторы:
eq равно
ne не равно
gt больше
ge больше или равно
lt меньше
le меньше или равно
like (только текстовый поиск) совпадение, если содержит шаблон.
Например,
count(600,12,gt) вернет точное количество значений больших чем &#039;12&#039; из истории за последние 10 минут.
Другой пример:
count(#10,12,gt,86400) вернет точное количество значений больших &#039;12&#039; из истории из последних 10 значений 24 часами ранее.
Если требуется подсчитывать произвольные значения, например, за последние 600 секунд 24 часами ранее, либо count(600,,86400) или count(600. 86400) должно быть использовано в зависимости от того что требуется подсчитать текст или числа, соответственно.
Параметр #num поддерживается начиная с Zabbix 1.6.1.
Параметр time_shift и строковые операторы поддерживаются начиная с Zabbix 1.8.2
date игнорируется любые
Возвращает текущую дату в формате ГГГГММДД.
Например: 20031025
dayofmonth игнорируется любые
Возвращает день месяца из диапазона от 1 до 31.
Эта функция поддерживается начиная с 1.8.5
dayofweek игнорируется любые
Возвращает день недели из диапазона от 1 до 7. Пн 1, Вс 7.
delta секунды или #num float, int
То же самое, что и max()-min().
Начиная с версии Zabbix 1.8.2 эта функция поддерживает секунды, необязательный параметр time_shift. Смотрите функцию avg для примера использования.
diff игнорируется float, int, str, text, log
Возвращает:
1 последнее и предыдущее значения различаются
0 наоборот
fuzzytime секунды float, int
Возвращает 1 если штамп времени (значения элемента данных) не отличается от времени на Zabbix сервере более чем на N секунд, 0 наоборот.
Обычно применяется с system.localtime, для проверки синхронно ли локальное время с локальным временем Zabbix сервера.
iregexp 1-ый строка, 2-ой секунды или #num str, log, text
Это не чувствительный к регистру аналог функции regexp.
last секунды или #num float, int, str, text, log
Последнее (самое новое) значение. Параметр:
секунды игнорируется
#num N-ное значение
Например,
last(0) всегда равняется last(#1)
last(#3) третье из последних значений
Функция поддерживает необязательный параметр time_shift. Например:
last(0,86400) вернет последнее значение одним днем ранее.
Zabbix не гарантирует точный порядок значений, если за одну секунду имеется более одного значения.
Параметр #num поддерживается начиная с Zabbix 1.6.2.
Параметр time_shift поддерживается начиная с Zabbix 1.8.2.
logeventid строка log
Проверяет соответствие регулярному выражению Event ID последней записи в журнале. Параметр определяет регулярное выражение в формате расширенных регулярных выражений POSIX.
Возвращает:
0 не соответствует
1 соответствует
Эта функция поддерживается начиная с версии 1.8.5
logseverity игнорируется log
Возвращает важность последней записи в журнале (логе). Параметры игнорируются.
0 важность по умолчанию
N важность (целое число, полезно для журналов событий Windows). Zabbix берет важность журнала из колонки Информация из журнала событий Windows.
logsource строка log
Проверяет совпадает ли последняя запись в логе с параметром.
0 не совпадает
1 совпадает
Обычно используется для журнала событий Windows. Например, logsource[VMWare Server]
max секунды или #num float, int
Максимальное значение за период времени. Параметр определяет период времени в секундах.
Начиная с версии Zabbix 1.8.2, функция поддерживает секунды, необязательный параметр time_shift. Смотрите функцию avg для примера использования.
min секунды или #num float, int
Минимальное значение за период времени. Параметр определяет период времени в секундах.
Начиная с версии Zabbix 1.8.2, функция поддерживает секунды, необязательный параметр time_shift. Смотрите функцию avg для примера использования.
nodata секунды любые
Возвращает:
1 если не было получено данных за указанный промежуток времени в секундах. Период не может быть меньше 30 секунд.
0 наоборот
now игнорируется любые
Возвращает количество секунд с начала Эпохи (00:00:00 UTC, 1 Января 1970 г.).
prev игнорируется float, int, str, text, log
Возвращает предыдущее значение. Параметр игнорируется.
Аналог last(#2)
regexp 1-ый строка, 2-ой секунды или #num str, log, text
Проверяет, соответствует ли последнее значение регулярному выражению. Параметр должен задаваться регулярным выражением в формате расширенных регулярных выражений POSIX.
Второй необязательный параметр это количество секунд или количество строк для анализа. В этом случае будет обработано более одного значения.
Эта функция чувствительная к регистру.
Возвращает:
1 если найдено
0 наоборот
str 1-ый строка, 2-ой секунды или #num str, log, text
Ищет строку в последнем значении. Параметр определяет строку для поиска. Эта функция чувствительная к регистру!
Второй необязательный параметр это количество секунд или количество строк для анализа. В этом случае будет обработано более одного значения.
Возвращает:
1 если найдено
0 если не найдено
strlen секунды или #num str, log, text
Длина последнего (наиболее нового) значения в символах (не в байтах).
Параметры такие же, как и для функции last.
Например,
strlen(0) идентично strlen(#1)
strlen(#3) длина третьего наиболее нового значения
strlen(0,86400) длина наиболее нового значения один день назад.
Эта функция поддерживается начиная с версии Zabbix 1.8.4.
sum секунды или #num float, int
Сумма значений за период времени. Параметр определяет период времени в секундах.
Начиная с версии Zabbix 1.8.2, функция поддерживает секунды, необязательный параметр time_shift. Смотрите функцию avg для примера использования.
time игнорируется любые
Возвращает текущее время в формате ЧЧММСС. Например: 123055

Большинство числовых функций принимают количество секунд в качестве аргумента. Вы также можете использовать префикс # чтобы указать, что аргумент имеет другое значение:

ВЫЗЫВАЕМАЯ ФУНКЦИЯ СМЫСЛ
sum(600) Сумма всех значений в течении 600 секунд
sum(#5) Сумма последних 5 значений

Функция last имеет особый смысл для значений с префиксом решетки функция выбирает N-ное предыдущее значение. Поэтому из представленных значений (выстроены от последних к предыдущим) 3, 7, 2, 6, 5, функция last(#2) вернет 7 и функция last(#5) вернет 5.

Выражения триггеров поддерживают использование различных множителей, такие как суффиксы.

Простое полезное выражение может выглядеть так:

Параметр должен быть предоставлен даже для тех функций, которые его игнорируют. Например: last(0)

Пример 1

Высокая загрузка процессора на www.zabbix.com

&#039;www.zabbix.com:system.cpu.load[all,avg1]&#039; передает короткое имя наблюдаемого параметра.
Эта строка указывает, что контролируется сервер &#039;www.zabbix.com&#039; и ключ &#039;system.cpu.load[all,avg1]&#039;. Используя функцию &#039;last()&#039;, мы ссылаемся на самое последнее значение. И наконец &#039;5&#039; означает, что триггер будет определен как ПРОБЛЕМА всякий раз, когда последнее значение загрузки процессора на сервере www.zabbix.com будет превышать 5.

Пример 2

Это выражение будет определено как ПРОБЛЕМА, когда либо текущая загрузка процессора больше 5, либо загрузка процессора больше 2 за последние 10 минут.

Пример 3

Изменился файл /etc/passwd

Используем функцию diff:

Это выражение будет определено как ПРОБЛЕМА, когда предыдущее значение контрольной суммы файла /etc/passwd отличается от последнего значения.

Аналогичные выражения могут быть полезны для мониторинга изменений в важных файлах, таких как /etc/passwd, /etc/inetd.conf, /kernel и других.

Пример 4

Кто-то скачивает большой файл из Интернет

Используем функцию min:

Это выражение будет определено как ПРОБЛЕМА, когда сумма полученных байт за последних 5 минут на интерфейсе eth0 превышает 100КБ.

Пример 5

Примечание, в выражении используются два разных узла сети:

Пример 6

Zabbix агент нуждается в обновлении

Используем функцию str():

Это выражение будет определено как ПРОБЛЕМА, когда версия Zabbix агента содержит в себе &#039;beta8&#039; (возможно 1.0beta8).

Пример 7

Выражение правдиво, если узел сети “zabbix.zabbix.comquot; недоступен более 5 раз за последние 30 минут.

Пример 8

Нет получения данных за последние 3 минуты

Используем функцию nodata():

‘tick’ должен иметь тип ‘Zabbix trapper’’. Для того чтобы этот триггер заработал, элемент данных ‘tick’ должен существовать. Узел сети должен периодически отправлять данные этому элементу данных используя zabbix_sender. Если не было получено данных за последние 180 секунд, значение триггера будет определено как ПРОБЛЕМА.

Пример 9

Активность ЦПУ в ночное время

Используем функцию time():

Триггер может быть определен как ПРОБЛЕМА только в ночное время (00:00-06:00).

Пример 10

Проверяет, если локальное время на клиенте синхронизировано с временем на Zabbix сервере

Используется функция fuzzytime():

Триггер меняет состояние на проблему тогда, когда локальное время на сервере MySQL_DB и Zabbix сервере различаются более чем на 10 секунд.

3 Зависимости триггеров

Зависимости триггеров могут быть использованы для определения взаимосвязи между триггерами.

Зависимости триггера являются очень удобным способом ограничения количества сообщений, которые будут отправлены в случае если возникающее событие относится к нескольким ресурсам.

Например, узел сети Хост находится позади маршрутизатора Роутер2, а Роутер2 находится позади Роутер1.

Если Роутер1 недоступен, то очевидно, что и Хост и Роутер2 недоступны. Никто не хочет получать три уведомления с информацией о Хост, Роутер1 и Роутер2. Это как раз тот случай, когда использование зависимостей триггера будет очень удобным.

Для этого случая, мы определяем эти зависимости:

Перед изменением состояния триггера &#039;Хост недоступен&#039;, Zabbix будет проверять существуют ли у этого триггера заданные зависимости. Если это так, и один из триггеров в находится в состоянии ПРОБЛЕМА, то состояние триггера не будет изменено и, следовательно, действие не будет выполнено и оповещение не будет отправлено.

Zabbix выполняет эту проверку рекурсивно. Если Роутер1 или Роутер2 недоступен, тогда триггер у Хоста не будет изменен.

4 Важности триггеров

Важность триггера определяет насколько триггер важен. Zabbix поддерживает следующие важности триггеров:

Важность Определение Цвет
Не классифицировано Неизвестная важность. Серый.
Информация В информационных целях. Светло зеленый.
Предупреждение Предупреждающий. Светло желтый.
Средняя Средняя проблема. Темно красный.
Высокая Произошло что-то важное. Красный.
Чрезвычайная Чрезвычайный. Финансовые потери и т.п. Ярко красный.

Важности могут быть использованы в:

5 Гистерезис

Иногда триггер должен иметь различные условия для разных состояний. Например, мы хотим определить триггер, который перейдет в состояние ПРОБЛЕМА если температура в серверной комнате поднимется выше 20 градусов. При этом триггер должен оставаться в состоянии ПРОБЛЕМА, пока температура не опустится ниже 15 градусов.

Для того чтобы сделать это, мы определим следующий триггер:

Пример 1

Температура в серверной комнате слишком высокая.

Примечание: Здесь используется макрос , который возвращает текущее состояние триггера (его числовое значение).

Пример 2

Осталось очень мало свободного места на диске

Проблема: осталось меньше чем 10ГБ за последние 5 минут

Восстановление: остается более чем 40ГБ за последние 10 минут

Примечание: Здесь используется макрос , который возвращает текущее состояние триггера (его числовое значение).

13 Комплексные экраны и слайдшоу

Комплексные экраны в Zabbix позволяют группировать различную информацию для быстрого доступа и отображения на одном экране. Простой в использовании конструктор экранов делает создание комплексных экранов простым и интуитивно понятным.

Комплексный экран это таблица которая может содержать в каждой ячейке следующую информацию:


Источник: news.desigoogly.com