Leap second привёл к зависанию некоторых серверов на Linux

в 5:04, , рубрики: crash, leap second, linux, метки: , ,

Пользователь Bron Gondwana на ServerFault отмечает, что начиная с утра 30-го июня некоторые его сервера на Debian Squeeze стали зависать, не подавая никаких признаков жизни.

С одного из серверов удалось вытащить вот такой дамп:

[3161000.864001] BUG: spinlock lockup on CPU#1, ntpd/3358
[3161000.864001] lock: ffff88083fc0d740, .magic: dead4ead, .owner: imapd/24737, .owner_cpu: 0


Остальные машины просто молча уходили в глубокую задумчивость и не возвращались.

Решением стало временное отключение ntpd на всех машинах.

Обидно, что баг был известен как минимум с 15-го марта.

Leap second day уже прошёл, поэтому детали по фиксу я не привожу, смотрите их в треде по ссылке выше. Тем не менее, кому-то эта информация может пригодиться при расследовании вчерашнего поведения машин. Тред также содержит очень подробное описание причин произошедшего.

P.S. В том же треде говорят, что в приложениях на Java наблюдались схожие проблемы.

Автор: agladysh

* - обязательные к заполнению поля