Три раза на разных VPS сталкивался с проблемой: каждые 15 минут апач на несколько секунд уходит и в это время валятся 502-ые ошибки. После изучения /var/log/nginx-access.log заметил, что ошибки происходят каждые 15 минут в течение нескольких секунд. То есть, например, в 11:00, 11:15, 11:30, 11:45 и т. д.
В поддержке одного из хостингов подсказали, что дело в мониторинге панели ISPmanager (watchdog). Как раз этот скрипт запускается каждые 15 минут.
Если отключить мониторинг апача (в панели Services -> HTTP), то ошибка исчезает. Но тогда апач в случае падения не перезапускается.
По подсказке поддержки другого хостинга посмотрел в /var/log/debug.log (лог watchdog-а):
Jan 24 18:30:01 site watchdog[10624]: Watchdog started
Jan 24 18:30:01 site watchdog[10624]: Watchdog create pid file
Jan 24 18:30:01 site watchdog[10624]: Before init
Jan 24 18:30:01 site watchdog[10624]: After init
Jan 24 18:30:01 site watchdog[10624]: Load WatchDog config
Jan 24 18:30:01 site watchdog[10624]: Config loaded
Jan 24 18:30:01 site watchdog[10624]: Begin check
Jan 24 18:30:01 site watchdog[10624]: Wait for finish
Jan 24 18:30:01 site watchdog[10624]: thread DNS finished with status OK
Jan 24 18:30:01 site watchdog[10624]: thread HTTP finished with status ERR
Jan 24 18:30:01 site watchdog[10624]: thread MySQL finished with status OK
Jan 24 18:30:11 site watchdog[10624]: thread SMTP finished with status OK
Jan 24 18:30:11 site watchdog[10624]: Begin restart
Jan 24 18:30:11 site watchdog[10624]: stop command '/usr/local/etc/rc.d/apache22 stop'
Jan 24 18:30:22 site watchdog[10624]: process name 'httpd'
Jan 24 18:30:22 site watchdog[10624]: start command '/usr/local/etc/rc.d/apache22 start'
Jan 24 18:30:44 site watchdog[10624]: Wait for finish
Jan 24 18:30:44 site watchdog[10624]: thread HTTP finished with status OK
Jan 24 18:30:46 site watchdog[10624]: Done
Судя по строчке "Jan 24 18:30:01 site watchdog[10624]: thread HTTP finished with status ERR" по какой-то причине каждые 15 минут watchdog думает, что апач не работает и перезапускает его.
Вероятно дело в нагруженности апача, но факт, что он не лежит каждые 15 минут.
Вопрос: как избавиться от такой ошибки?
Ответы
Смотрите конфигурацию watchdog. Либо он не может найти pid-файл Apache, либо не может подключиться к порту, на котором работает Apache.
Следовательно, "думает", что Apache не работает и перезапускает его. На время перезапуска неизбежна остановка веб-сервисов.
Однажды решил такую проблему, убрав apache из мониторинга watchdog, и установив для его мониторинга monit.
Тупо немогу зайти на сайт и все везде но не там :(
Отправить комментарий