Nagios не включает plugin для мониторинга памяти. Вероятнее всего потому что нет единой команды для подсчета свободной памяти. Так как вся свободная память идет в буферы и в кэш, но есть скрипт, который делает подсчет памяти.
Логика скрипта:
free=`free -m | grep "buffers/cache" | awk '{print $4}'` used=` free -m | grep "buffers/cache" | awk '{print $3}'` total=$(($free+$used)) result=$(echo "$used / $total * 100" |bc -l|cut -c -2)
Полный листинг скрипта:
#!/bin/bash # # Script to check memory usage on Linux. Ignores memory used by disk cache. # # Requires the bc command # print_help() { echo "Usage:" echo "[-w] Warning level as a percentage" echo "[-c] Critical level as a percentage" exit 0 } while test -n "$1"; do case "$1" in --help|-h) print_help exit 0 ;; -w) warn_level=$2 shift ;; -c) critical_level=$2 shift ;; *) echo "Unknown Argument: $1" print_help exit 3 ;; esac shift done if [ "$warn_level" == "" ]; then echo "No Warning Level Specified" print_help exit 3; fi if [ "$critical_level" == "" ]; then echo "No Critical Level Specified" print_help exit 3; fi free=`free -m | grep "buffers/cache" | awk '{print $4}'` used=` free -m | grep "buffers/cache" | awk '{print $3}'` total=$(($free+$used)) result=$(echo "$used / $total * 100" |bc -l|cut -c -2) if [ "$result" -lt "$warn_level" ]; then echo "Memory OK. $result% used." exit 0; elif [ "$result" -ge "$warn_level" ] && [ "$result" -le "$critical_level" ]; then echo "Memory WARNING. $result% used." exit 1; elif [ "$result" -gt "$critical_level" ]; then echo "Memory CRITICAL. $result% used." exit 2; fi
Использование скрипта
# ./check_memory -w 50 -c 55 Memory OK. 33% used. # # ./check_memory -w 25 -c 20 Memory CRITICAL. 33% used.
Добавляем мониторинг памяти в Nagios
На сервере в Nagios hosts добавляем:
# Service definition define service{ # Name of service template to use use generic-service host_name TEST service_description LA is_volatile 0 check_period 24x7 max_check_attempts 3 normal_check_interval 1 retry_check_interval 1 #contact_groups admins notification_interval 120 notification_period 24x7 notification_options c,r check_command check_nrpe!check_memory }
Перезагружаем Nagios
# service nagios restart
На Машине клиенте добавляем данный скрипт в папку с плагинами Nagios
# vi /usr/lib/nagios/plugins/check_memory # Копируем скрипт # chmod 755 check_memory
В файле /etc/nagios/nrpe.cfg задаем параметры проверки warning и critical
command[check_memory]=/usr/lib/nagios/plugins/check_memory -w 85 -c 90
Перезагружаем nrpe
# service nrpe restart
Идем на веб-интерфейс Nagios, и радуемся жизни! 🙂