- PVSM.RU - https://www.pvsm.ru -
В этой заметке перечислены несколько простых способов заблаговременно узнать о различных проблемах на сервере, не замусоривая почтовый ящик и не настраивая сложных систем мониторинга. Из разряда «если вам лень что-то проверять и настраивать, то настройте и проверяйте хотя бы это».
Часть перечисленных ниже утилит умеет самостоятельно отправлять email-уведомления, для остальных предлагаются несложные shell-обёртки.
В качестве получателя используется дополнительная локальная рассылка admins, которая включает в себя локального root и внешнего admin@example.ru. Почему вместо этого не переопределяется локальный root?
Во-первых, root может по умолчанию принимать много информационных писем, которые помогают _понять_ причину уже _обнаруженной_ проблемы. Они важны, но если отправлять все эти письма наружу, либо потребуется настраивать их фильтрацию, либо повышается вероятность пропустить в их потоке письма, позволяющие _обнаружить_ ещё _неизвестную_ проблему.
Во-вторых, т.к. admins не является стандартным аккаунтом или группой в популярных Linux/Unix-системах, то "grep -r admins /etc /usr/local/etc
позволяет быстро определять, для каких утилит настройка уже выполнена.
Определение используемого сервера:
dpkg-query -L /usr/sbin/sendmail
(Debian-based)rpm -qf /usr/sbin/sendmail
(RPM-based)sudo netstat -ntlp | grep :25
(all Linux)sockstat -4l | grep :25
(FreeBSD)Возможные варианты в Debian и Ubuntu: http://packages.debian.org/file:/usr/sbin/sendmail [1]
Дальше все пути и ключи команд приведены в расчёте на Debian, за исключением утилит для FreeBSD, отсутствующих в Linux.
/etc/aliases:
admins: root, admin@example.ru
virtual_alias_maps = hash:/etc/postfix/virtual
admins root admin@example.ru
Формальные достоинства по сравнению с полноценным MTA:
Фактические недостатки:
Таким образом, единственное место, где imho имеет смысл их использовать — легковесные виртуальные контейнеры, для пересылки на SMTP-сервер, запущенный на Host OS.
Даже о таком важном событии, как внеплановые перезагрузки, некоторые администраторы узнают, случайно проверив uptime или last. Немедленно быть в курсе событий поможет следующая строка над «exit» в /etc/rc.local:
M="Booting complete on $(hostname)."; echo $M | mail -s "$M" admins
MAILADDR admins
DEVICESCAN ... -m admins ...
/usr/local/sbin/healthd.sh &
#!/bin/sh
test -z "$(which sensors)" &while : ; do
sensors | grep -q ALARM || { sleep 15; continue; }
sensors | grep -q ALARM | logger -s -t "sensors" -p local0.crit
sensors | mail -s "Hardware Health Warning" "admins"
sleep 600
done
Другие варианты:
/usr/local/sbin/aacraid-check | mail -e -s 'RAID Alert' admins
Другие варианты:
#!/bin/sh
cd /dev
for n in ar?; do
test "$n" = 'ar?' && exit # ..no ATA RAID
#echo "Check $n..."
atacontrol status $n | egrep -qv '(READY|ONLINE|subdisks:)' || continue
atacontrol status $n | mail -s 'ATA RAID Warning' admins
atacontrol status $n | logger -p local4.crit -t RAIDCheck -s
done
Ежедневная проверка переполнения квот в контейнерах – sources.homelink.ru/openvz/ [9]
На 90% заметка представляет собой копипасту из локальной wiki. Если кому-то пригодится — хорошо. Не пригодится — ничего страшного ;-))
Автор: IlyaEvseev
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/linux/11327
Ссылки в тексте:
[1] http://packages.debian.org/file:/usr/sbin/sendmail: http://packages.debian.org/file:/usr/sbin/sendmail
[2] lm-sensors.org/browser/lm-sensors/trunk/prog/daemon/healthd.sh: http://lm-sensors.org/browser/lm-sensors/trunk/prog/daemon/healthd.sh
[3] www.lm-sensors.org/attachment/ticket/2133/sensormon: http://www.lm-sensors.org/attachment/ticket/2133/sensormon
[4] sourceforge.net/projects/lm-monitor/: http://sourceforge.net/projects/lm-monitor/
[5] репозиторий с пакетом для Debian: http://hwraid.le-vert.net/wiki/DebianPackages
[6] /usr/local/sbin/aacraid-check: http://sources.homelink.ru/hardmon/aacraid-check.txt
[7] www.sysadmintalk.net/forums/thread-1062.html: http://www.sysadmintalk.net/forums/thread-1062.html
[8] hwraid.le-vert.net/wiki/Adaptec#a3.3.aacraid-status: http://hwraid.le-vert.net/wiki/Adaptec#a3.3.aacraid-status
[9] sources.homelink.ru/openvz/: http://sources.homelink.ru/openvz/
Нажмите здесь для печати.