Создание надёжного хранилища раздаваемого нескольким серверам по nfs

При создании кластера для обработки звонков на базе CGP ^[1] возникла необходимость настройки бесперебойного хранилища, монтируемого с нескольких сервров.

В качестве дистрибутиа для серверов был взят Ubuntu Server 10.10. Дисковое пространство было разбито на два логических диска (sda1 для установки системы, и sda2 собственно для разделяемого диска).

После установки базовой системы надо дополнительно установить следующие пакеты: heartbeat, pacemaker, drbd8-utils, xfs, xfsprogs, nfs-kernel-server.

Heartbeat и pacemaker нужны для кластеризации серверов. Хранилище сделано на основе drbd, в качестве файловой системы использовалась xfs. Раздача файловой системы серверам сделана по nfs.

1. Настройка системы

Для нод были выбраны имена u1 и u2. Для удобста эти имена сразу были прописаны в /etc/hosts:

10.0.0.84  u1
10.0.0.115 u2
10.0.0.120 u0

u0 — это адрес по которому хранилище доступно для монтирования файловой системы с остальных серверов.

2. Настройка drbd

Файл с конфигурацией хранилища распологается в /etc/drbd.d/r0.res:

resource r0 {
    protocol C;
    syncer {
        rate 4M;
    }
    startup {
        wfc-timeout 15;
        degr-wfc-timeout 60;
    }
    net {
        after-sb-0pri discard-zero-changes;
        after-sb-1pri discard-secondary;
        after-sb-2pri disconnect;
        cram-hmac-alg sha1;
        shared-secret somesecretword;
    }
    on u1 {
        device /dev/drbd0;
        disk /dev/sda2;
        address 10.0.0.84:7788;
        meta-disk internal;
    }
    on u2 {
        device /dev/drbd0;
        disk /dev/sda2;
        address 10.0.0.115:7788;
        meta-disk internal;
    }
}

На обоих нодах файл одинаковый, так что можно создать на одной, а затем скопировать на вторую.

Такая жестокоя настройка для лечения split brain была выбрана, так как хранилище используется в основном для хранения конфигурации системы. То есть потеря последних изменения не так критична, как потеря звонков во время простоя по причине slit blain.

После создания файла конфигурации надо создать сами диски на обоих серверах кластера:

dd if=/dev/zero of=/dev/sda2 bs=64M
drbdadm create-md r0

После этого можно стартовать drbd. Важно запустить drbd демон на обоих серверах с разницой меньше минуты (таймаут для связи с другими членами кластера):

/etc/init.d/drbd start

После этго в /proc/drbd будет состояние хранилища, в примерно таком виде:

0: cs:Connected ro:Secondary/Secondary ds:Inconsistent/Inconsistent C r----

То есть две ноды в режиме secondary, при этом диск неконсистетный. Чтобы выйти из этого положения надо насильно объявить одну из нод кластера главной, чтобы это сделать надо выполнить команду:

drbdadm -- --overwrite-data-of-peer primary r0

После этого drbd начнёт обновлять состояние secondary диска:

0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r----
ns:241984 nr:0 dw:0 dr:242184 al:0 bm:14 lo:510 pe:179 ua:510 ap:0 ep:1 wo:b oos:782664
        [===>................] sync'ed: 23.6% (782664/1023932)K
        finish: 0:04:04 speed: 3,160 (3,172) K/sec

После того, как синхронизация закончится можно создавать файловую систему, на сервере, где drbd в состоянии primary:

mkfs.xfs /dev/drbd0

Для следующих шагов нам будет мешать стандартный механизм запуска демонов. Поэтому надо выполнить на обоих серверах команду:

update-rc.d -f drbd remove

3. Настройка heartbeat

Конфигурация создаётся в файле /etc/heartbeat/ha.cf. На обоих нодах он одинаковый, так что можно создать на одной, а затем скопировать на вторую.

logfacility daemon
keepalive 2
deadtime 15
warntime 5
initdead 120
udpport 694
ucast eth0 10.0.0.115
ucast eth0 10.0.0.84
auto_failback on
node u1
node u2
use_logd yes
crm respawn

Второй файл служит для аутентификации /etc/heartbeat/authkeys:

auth 1
1 sha1 somesecretword

Лучше не дожидаться предупреждения от heartbeat на неправильные атрибуты файла и поменять их заранее:

chmod 600 /etc/heartbeat/authkeys

После этого можно стартовать heartbeat:

/etc/init.d/heartbeat start

Через некоторое время команда crm_mod должно показать, что две ноды подключились к друг-другу:

============
Last updated: Fri Feb 10 09:33:04 2012
Stack: Heartbeat
Current DC: u1 (86b204d8-ee3e-47c7-ba0e-1dcbd40a20da) - partition with quorum
Version: 1.0.9-unknown
2 Nodes configured, 2 expected votes
2 Resources configured.
============

Online: [ u2 u1 ]

Далее надо выполнить команду crm configure edit и ввести настройку для кластера:

node $id="86b204d8-ee3e-47c7-ba0e-1dcbd40a20da" u1
node $id="c6e3c21f-da3e-4031-9f28-a7e33425a817" u2
primitive drbd0 ocf:linbit:drbd 
        params drbd_resource="r0" 
        op start interval="0" timeout="240" 
        op stop interval="0" timeout="100" 
        op monitor interval="20" role="Slave" timeout="20" depth="0" 
        op monitor interval="10" role="Master" timeout="20" depth="0"
primitive fs0 ocf:heartbeat:Filesystem 
        params directory="/shared" fstype="xfs" device="/dev/drbd/by-res/r0" options="noatime,nodiratime,nobarrier,logbufs=8" 
        op start interval="0" timeout="60" 
        op stop interval="0" timeout="60" 
        op notify interval="0" timeout="60" 
        op monitor interval="20" timeout="40" depth="0" 
        meta target-role="Started"
primitive ip0 ocf:heartbeat:IPaddr2 
        params ip="10.0.0.120" nic="eth0:0" 
        op monitor interval="5s" 
        meta target-role="Started"
primitive nfs0 ocf:itl:exportfs 
        params directory="/shared" clientspec="10.0.0.0/255.255.255.0" options="rw,no_root_squash,sync,no_wdelay" fsid="1" 
        op start interval="0" timeout="40" 
        op stop interval="0" timeout="60" 
        op monitor interval="30" timeout="55" depth="0" OCF_CHECK_LEVEL="10" 
        meta target-role="Started"
group ha_nfs fs0 nfs0 ip0 
        meta target-role="Started"
ms ms_drbd0 drbd0 
        meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"
colocation c_nfs inf: nfs0 ms_drbd0:Master
order o_nfs inf: ms_drbd0:promote ha_nfs:start
property $id="cib-bootstrap-options" 
        dc-version="1.0.9-unknown" 
        cluster-infrastructure="Heartbeat" 
        stonith-enabled="false" 
        expected-quorum-votes="2" 
        no-quorum-policy="ignore" 
        symmetric-cluster="true" 
        last-lrm-refresh="1328625786"
rsc_defaults $id="rsc_defaults-options" 
        resource-stickiness="10000"

Настройки exportfs говорят о том, что директория, где будет смонтирована общая файловая система /shared, монтировать этот ресурс по nfs можно будет всем серверам из сети 10.0.0.0.

Через некоторое время монитор кластера должен показать состояние ресурсов:

============
Last updated: Fri Feb 10 09:33:04 2012
Stack: Heartbeat
Current DC: u1 (86b204d8-ee3e-47c7-ba0e-1dcbd40a20da) - partition with quorum
Version: 1.0.9-unknown
2 Nodes configured, 2 expected votes
2 Resources configured.
============

Online: [ u2 u1 ]

 Resource Group: ha_nfs
     fs0        (ocf::heartbeat:Filesystem):    Started u1
     nfs0       (ocf::itl:exportfs):    Started u1
     ip0        (ocf::heartbeat:IPaddr2):       Started u1
 Master/Slave Set: ms_drbd0
     Masters: [ u1 ]
     Slaves: [ u2 ]

4. Монтирование общей файловой системы с других серверов

Для этого можно использовать /etc/fstab:

u0:/shared /var/CommuniGate/SharedDomains nfs bg,intr	0 0

5. Дополнительные ссылки

При создании конфигурации за основу было взято описание http://library.linode.com/linux-ha/ip-failover-heartbeat-pacemaker-drbd-mysql-ubuntu-10.04 ^[2]
Инструкция по лечени split-brain у drbd http://www.alsigned.ru/?p=490 ^[3]
В Ubuntu 10.10 exportfs агент не входит, поэтому его надо скачивать отдельно (https://github.com/ClusterLabs/resource-agents/blob/master/heartbeat/exportfs ^[4]) и установить в /usr/lib/ocf/resource.d/heartbeat/
В данной конфигурации нет важной части — STONITH (http://linux-ha.org/wiki/STONITH ^[5]), так как нет резервного канала
Описание механизма использования общего адреса можно прочитать на http://www.ultramonkey.org/3/ip_address_takeover.html ^[6]

Автор: freewind

Источник ^[7]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/linux/54410

Ссылки в тексте:

[1] CGP: http://communigate.com

[2] http://library.linode.com/linux-ha/ip-failover-heartbeat-pacemaker-drbd-mysql-ubuntu-10.04: http://library.linode.com/linux-ha/ip-failover-heartbeat-pacemaker-drbd-mysql-ubuntu-10.04

[3] http://www.alsigned.ru/?p=490: http://www.alsigned.ru/?p=490

[4] https://github.com/ClusterLabs/resource-agents/blob/master/heartbeat/exportfs: https://github.com/ClusterLabs/resource-agents/blob/master/heartbeat/exportfs

[5] http://linux-ha.org/wiki/STONITH: http://linux-ha.org/wiki/STONITH

[6] http://www.ultramonkey.org/3/ip_address_takeover.html: http://www.ultramonkey.org/3/ip_address_takeover.html

[7] Источник: http://habrahabr.ru/post/137938/

Нажмите здесь для печати.