воскресенье, 14 августа 2011 г.

Изменение интервала обработки данных Munin

В случае большого количества хостов мунин может не успевать обработать все данные до следующего запуска и процессы будут накладываться друг на друга. Об этом говорят письма с таким текстом:

[FATAL ERROR] Lock already exists: /var/run/munin/munin-update.lock. Dying.
 at /usr/local/lib/perl5/site_perl/5.10.1/Munin/Master/Update.pm line 128

Первой мыслью является увеличение интервала между запусками с 5 минут по умолчанию на более высокое значение. Это действительно решает проблему, но на графиках появляются разрывы, поскольку rrdtool ожидает получать данные каждые 5 мин.
Решение заключается в том, чтобы заменить вызов munin-cron непосредтсвенным запуском его компонентов:
  1. munin-update
  2. munin-limits
  3. munin-graph
  4. munin-html
Запускать их нужно именно в таком порядке. Первые два munin-update и munin-limits должны запускаться каждые 5 минут:
*/5 * * * *     /usr/local/share/munin/munin-update
*/5 * * * *    
/usr/local/share/munin/munin-limits
Именно они отвечают за сбор данных с узлов и сохранению в rrdtool.

Два других генерируют графики и html, поэтому интервал запуска может быть увеличен:
*/10 * * * * /usr/local/share/munin/munin-graph --cron 2>&1 &&
*/10 * * * * /usr/local/share/munin/munin-html

Комментариев нет:

Отправить комментарий