- PVSM.RU - https://www.pvsm.ru -

Leap second привёл к зависанию некоторых серверов на Linux

Пользователь Bron Gondwana на ServerFault отмечает [1], что начиная с утра 30-го июня некоторые его сервера на Debian Squeeze стали зависать, не подавая никаких признаков жизни.

С одного из серверов удалось вытащить вот такой дамп:

[3161000.864001] BUG: spinlock lockup on CPU#1, ntpd/3358
[3161000.864001] lock: ffff88083fc0d740, .magic: dead4ead, .owner: imapd/24737, .owner_cpu: 0


Остальные машины просто молча уходили в глубокую задумчивость и не возвращались.

Решением стало временное отключение ntpd на всех машинах.

Обидно, что баг был известен как минимум с 15-го марта [2].

Leap second day уже прошёл, поэтому детали по фиксу я не привожу, смотрите их в треде по ссылке выше. Тем не менее, кому-то эта информация может пригодиться при расследовании вчерашнего поведения машин. Тред также содержит очень подробное описание причин произошедшего.

P.S. В том же треде говорят, что в приложениях на Java наблюдались схожие проблемы.

Автор: agladysh


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/linux/10552

Ссылки в тексте:

[1] отмечает: http://serverfault.com/q/403732/1355

[2] известен как минимум с 15-го марта: http://lkml.indiana.edu/hypermail/linux/kernel/1203.1/04598.html