Введение в LPIC-3 306: высокая доступность и хранилища

Рейтинг: 57.8% · 13 голосов
Специализация LPIC-3 306 (v3.0): кластеры HA (Pacemaker/Corosync), балансировка (LVS, keepalived, HAProxy), DRBD, кластерные и распределённые ФС (GFS2, OCFS2, GlusterFS, Ceph), iSCSI/multipath, advanced RAID/LVM.
Ответить
Аватара пользователя
Sergey_Sysadmin
Сообщения: 134
Зарегистрирован: 11 май 2026, 05:31

Введение в LPIC-3 306: высокая доступность и хранилища

Сообщение Sergey_Sysadmin »

Оглавление курса (14)
  1. Введение в LPIC-3 306: высокая доступность и хранилища (вы здесь)
  2. Концепции и теория высокой доступности [361.1]
  3. Кластеры с балансировкой нагрузки [361.2]
  4. Failover-кластеры: Corosync и Pacemaker [361.3, часть 1]
  5. Pacemaker: ресурсы, ограничения, fencing [361.3, часть 2]
  6. DRBD [362.1]
  7. Доступ к кластерному хранилищу [362.2]
  8. Кластерные файловые системы [362.3]
  9. Распределённое хранилище GlusterFS [363.1]
  10. Ceph: архитектура [363.2, часть 1]
  11. Ceph: использование и эксплуатация [363.2, часть 2]
  12. Отказоустойчивость узла: железо и сервисы [364.1]
  13. Продвинутый RAID
  14. Продвинутый LVM и сетевая отказоустойчивость [364.3 + 364.4]
Урок 0. Введение в LPIC-3 306: высокая доступность и хранилища

Этот курс готовит к экзамену 306-300 (версия 3.0) - последней ступени LPIC-3, посвящённой высокой доступности и кластерным хранилищам. Задача администратора здесь меняется качественно: вы перестаёте чинить отдельный сервер и начинаете проектировать систему, которая переживёт смерть этого сервера без участия человека. В нулевом уроке мы разберём язык, на котором об этом говорят: что такое доступность и как её считают, что такое единая точка отказа, что означают RTO и RPO, и куда в этой картине ложатся четыре больших темы экзамена - сам кластерный менеджер, кластерное хранилище, распределённое хранилище и резервирование одного узла.

Изображение

Как это работает

Высокая доступность (HA) - это свойство сервиса оставаться рабочим, несмотря на отказ отдельных компонентов. Ключевое слово - сервис, а не сервер. Пользователю не важно, какая именно нода отвечает на запрос; ему важно, что запрос обслужен. Поэтому HA-инженер мыслит не машинами, а ресурсами (IP-адрес, файловая система, демон базы) и тем, как эти ресурсы перетекают между узлами.

Враг номер один - единая точка отказа, SPOF (single point of failure). Это любой элемент, чья поломка валит весь сервис: один блок питания, один коммутатор, один диск, один балансировщик, один человек, который знает пароль. Проектирование HA - это методичный обход системы и устранение каждого SPOF дублированием. Важно: дублирование без автоматики не даёт HA. Два сервера, между которыми вы переключаетесь руками ночью, - это резерв, но не высокая доступность.

Доступность измеряют в процентах за период и привычно называют девятками. 99 процентов (две девятки) - это около 3.65 суток простоя в год. 99.9 (три девятки) - примерно 8.77 часа. 99.99 (четыре девятки) - около 52.6 минуты. 99.999 (пять девяток, эталон телекома) - около 5.26 минуты в год. Каждая лишняя девятка дороже предыдущей в разы, потому что требует убрать всё больше SPOF и всё точнее автоматику. Бизнес почти никогда не хочет максимума - он хочет ровно тот уровень, который окупается.

Две метрики описывают сам инцидент. RTO (Recovery Time Objective) - сколько максимум сервис может лежать, то есть целевое время восстановления. RPO (Recovery Point Objective) - сколько данных допустимо потерять, измеряется во времени до последней сохранной точки. RTO двигают кластеризацией и быстрым failover; RPO двигают репликацией и частотой бэкапов. Пример: синхронная репликация даёт RPO около нуля (потерь нет), но дороже и медленнее; бэкап раз в сутки даёт RPO до 24 часов, зато дёшев.

Отдельно держите в голове разницу между доступностью и сохранностью. Кластер может мгновенно поднять сервис на второй ноде (отличный RTO), но если данные были на одном диске без репликации, поднимать будет нечего. Поэтому экзамен 306 идёт двумя ветками сразу: оркестрация ресурсов (Pacemaker, Corosync) и собственно данные (общие и распределённые ФС).

Команды и примеры

Прикинуть бюджет простоя из девяток - арифметика, которую полезно держать под рукой:

Код: Выделить всё

# минут простоя в год = 525600 * (1 - доступность)
# 99.9%   -> 525600 * 0.001  = 525.6 мин  (~8.8 ч)
# 99.99%  -> 525600 * 0.0001 = 52.56 мин
# 99.999% -> 525600 * 0.00001 = 5.256 мин
python3 -c "print(525600*(1-0.9999), 'минут в год')"
Большинство тем курса крутится вокруг стека Corosync (членство и обмен сообщениями между нодами) плюс Pacemaker (менеджер ресурсов). Ставится он по-разному в двух семействах:

Код: Выделить всё

# Debian 13 / Ubuntu 24.04 LTS
apt update
apt install -y pacemaker corosync pcs fence-agents-base
# RHEL 10 / Fedora 41+ (репозиторий HighAvailability)
dnf install -y pacemaker corosync pcs fence-agents-all
Управляющий демон и базовый осмотр кластера (одинаково в обоих семействах, systemd):

Код: Выделить всё

systemctl enable --now pcsd
pcs status            # сводка по нодам и ресурсам
crm_mon -1           # снимок состояния один раз
corosync-cfgtool -s  # видны ли соседи на кольце
Уточнить версии стенда, чтобы соответствовать реалиям 2026:

Код: Выделить всё

# Debian/Ubuntu
dpkg -l pacemaker corosync | grep ^ii
cat /etc/os-release
# RHEL/Fedora
rpm -q pacemaker corosync pcs
Частые грабли
  • Путают резерв и HA. Ручное переключение - это не высокая доступность; без автоматики failover RTO остаётся часами.
  • Считают, что репликация заменяет бэкап. Репликация мгновенно копирует и ошибку, и удаление; для RPO катастроф нужен независимый бэкап.
  • Обещают бизнесу пять девяток, не убрав сетевые и питающие SPOF. Софтовый кластер на одном коммутаторе и одном вводе питания пять девяток не даст.
  • Забывают про fencing. Кластер без изоляции сбойного узла рано или поздно поймает split-brain и порчу данных - это отдельная большая тема дальше по курсу.
  • Берут устаревшие гайды с yum, pcs cluster setup старого синтаксиса и SysVinit-скриптами. В 2026 это dnf/dnf5, systemd и текущий синтаксис pcs.
Мини-лаба
  • Поднимите две одинаковые виртуалки (RHEL 10 или Debian 13), задайте им имена node1 и node2, пропишите друг друга в /etc/hosts.
  • Установите пакеты pacemaker, corosync, pcs из примеров выше под своё семейство.
  • Включите и запустите pcsd через systemctl на обеих нодах.
  • Выполните pcs status и зафиксируйте, что кластера ещё нет - это нормальная отправная точка.
  • Для каждой ноды выпишите её потенциальные SPOF: диск, сеть, питание, гипервизор. Отметьте, какие из них в вашем стенде общие для обеих нод.
  • Посчитайте допустимый годовой простой для целей 99.9 и 99.99 процента и сформулируйте, какой RTO и RPO вы хотите от будущего кластера.
Контрольные вопросы
  • Чем высокая доступность отличается от простого резервирования, и почему дублирование без автоматики её не обеспечивает?
  • Сколько минут простоя в год допускают четыре и пять девяток, и почему каждая следующая девятка дороже?
  • В чём разница между RTO и RPO, и какими техническими средствами двигают каждую из этих метрик?
  • Приведите три примера SPOF, которые софтовый кластер Pacemaker сам по себе не устраняет.
  • Почему синхронная репликация даёт RPO около нуля, но не отменяет необходимости бэкапа?
  • Какие две роли играют Corosync и Pacemaker и почему их разделяют?
👍1 ❤️2 🔥 😄 🤔1
Аватара пользователя
emacs95
Сообщения: 1
Зарегистрирован: 11 май 2026, 00:44

Re: Введение в LPIC-3 306: высокая доступность и хранилища

Сообщение emacs95 »

А fencing это и есть тот самый stonith про который везде пишут? или разные вещи
👍3 ❤️ 🔥 😄 🤔1
Аватара пользователя
pattinn
Сообщения: 1
Зарегистрирован: 13 май 2026, 16:10

Re: Введение в LPIC-3 306: высокая доступность и хранилища

Сообщение pattinn »

посчитал свой прод: вышло 99.95, начальство хочет четыре девятки. получается надо убирать общий коммутатор первым делом, он у нас один на стойку
👍1 ❤️2 🔥 😄 🤔
Ответить
Следующая глава →
Концепции и теория высокой доступности [361.1]

Все главы курса «LPIC-3 306: высокая доступность и хранилища»

Поделиться темой: ✈ Telegram VK
  • Похожие темы

Вернуться в «LPIC-3 306: высокая доступность и хранилища»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость