Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Рейтинг: 20.7% · 1 голосов
Дистрибутивы Linux, настройка серверов, сети, systemd, bash-скрипты, безопасность, бэкапы, мониторинг и сопровождение инфраструктуры.
Ответить
Аватара пользователя
katykat
Сообщения: 7
Зарегистрирован: 13 май 2026, 22:27

Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение katykat »

Рассказываю, пока горит. Контора сидела на CentOS 7 до последнего, EOL был ещё в июне 2024, но руководству было пофиг, работает же. В этом году прилетело сразу два требования: ИБ хочет реестровый дистрибутив на контурах с персданными, остальное надо хотя бы перевести на поддерживаемое. Решили так: РЕД ОС 8 туда, где госданные, AlmaLinux 9 на всё остальное.

План был красивый: elevate/leapp для in-place апгрейда альмы, ред ос ставим начисто. По факту elevate упал на 7 машинах из 18 из-за стороннего kmod от агента бэкапа, который забыли снести. На двух машинах после апгрейда не поднялась сеть, старые ifcfg скрипты девятка через NetworkManager читает уже криво, у меня bond просто исчез. А вишенка: биллинг на php 5.6 (да, я знаю), который тащил пакеты из remi под centos 7 и после апгрейда умер целиком. Узнали об этом в субботу утром от клиентов.

Откатывался со снапшотов, благо виртуалки. Две недели разгребал. Вывод: in-place апгрейд через два мажорных релиза это лотерея, проще катить чистые машины ансиблом и переносить сервисы по одному. Кто проходил подобное, как вы вообще выбивали у руководства время на нормальную миграцию, а не вот это вот всё?
👍1 ❤️ 🔥1 😄 🤔1
✔ Лучший ответ сформирован автоматически — raspberryguru
Manuelriere писал(а):это не лотерея, это невыполненный чеклист легко говорить, когда preupgrade отчет уже видел. там портянка на пару сотен строк, часть пунктов inhibitor, остальное шум, и сторонний kmod от какого-нибудь касперского или агента бэкапа в этом шуме теряется на раз. формально да, написано. фактически leapp до сих пор не умеет сказать человеческим языком: вот эти три строчки сделай об…
Перейти к ответу →
Аватара пользователя
regexlover
Сообщения: 18
Зарегистрирован: 21 май 2026, 11:59

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение regexlover »

@katykat, php 5.6 в проде в 2026 это сильнее любого факапа с миграцией, если честно. Сочувствую, но биллинг сам напросился
👍3 ❤️ 🔥 😄1 🤔
Аватара пользователя
tommee
Сообщения: 64
Зарегистрирован: 11 май 2026, 02:37

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение tommee »

@katykat, Про РЕД ОС потом отдельно расскажи, как оно после альмы в эксплуатации. Мы сейчас выбираем между ним и Астрой для аттестуемого контура, ИБ топит за Астру, потому что сертификатов больше, а мне ред ос милее, он ближе к привычной RHEL-вселенной и меньше сюрпризов в пакетной базе.
👍 ❤️1 🔥 😄 🤔
Аватара пользователя
marianna
Сообщения: 70
Зарегистрирован: 11 май 2026, 11:23

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение marianna »

как выбивали время у руководства. Никак. У руководства никогда нет денег на миграцию, но всегда находятся деньги на тушение пожара. Твоя суббота с лежащим биллингом это и есть бюджет на миграцию, просто согласованный задним числом, хах
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
Manuelriere
Сообщения: 58
Зарегистрирован: 13 май 2026, 17:46

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение Manuelriere »

у elevate в документации прямым текстом написано: снести сторонние kmod перед апгрейдом, там даже preupgrade check на это есть. Не в обиду, но это не лотерея, это невыполненный чеклист. Хотя про ifcfg согласен, мина знатная, у меня после перехода на keyfiles тоже полночи сеть по консоли поднимал.
👍 ❤️1 🔥1 😄 🤔1
Аватара пользователя
Yuliyazhelman
Сообщения: 8
Зарегистрирован: 11 май 2026, 05:12

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение Yuliyazhelman »

оффтоп, а что за агент бэкапа был? Если Veeam, то он из РФ ушёл, чем заменяете? Мы смотрим на Киберпротект, но ценник на 40 машин конский, под миллион в год выходит, и это ещё по партнёрской скидке.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
aaannn
Сообщения: 16
Зарегистрирован: 16 май 2026, 02:45

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение aaannn »

@Manuelriere, а почему альма, а не рокки? У нас этот холивар уже месяц идёт и не кончается. Хотя по мне после 9.5 альма чуть отошла от bug-for-bug совместимости и для 95 процентов задач разницы вообще ноль, кидайте монетку и работайте.
👍 ❤️1 🔥 😄 🤔
Аватара пользователя
nodice
Сообщения: 36
Зарегистрирован: 10 май 2026, 23:58

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение nodice »

перевозил похожий парк прошлой осенью, около 50 машин. после третьего leapp плюнул и дальше катал чистую альму киксстартом плюс ансибл, по времени вышло быстрее, чем разгребать сюрпризы in-place. апгрейд на месте оправдан только там, где конфиг руками намазан за десять лет и его никто не помнит. и да, ifcfg это боль, у нас половина скриптов мониторинга парсила вывод ifconfig, которого в 9 уже просто нет. всплыло, конечно же, ночью
👍2 ❤️1 🔥1 😄 🤔
Аватара пользователя
qemukun
Сообщения: 29
Зарегистрирован: 15 май 2026, 03:32

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение qemukun »

@Yuliyazhelman, мы после ухода вима разделили: виртуалки бэкапит Proxmox Backup Server, он бесплатный, а на железных машинах restic в s3-совместимое хранилище. на 40 машин выходит сильно дешевле миллиона, по сути платишь только за сторадж. Киберпротект щупали: рабочий, но консоль из 2012 и ценник ровно как ты описываешь. единственное, что реально потеряли против вима, это гранулярное восстановление из гостевых баз, но оно нам было нужно раз в год
👍1 ❤️ 🔥 😄1 🤔
Аватара пользователя
raspberryguru
Сообщения: 14
Зарегистрирован: 11 май 2026, 05:05

Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа

Сообщение raspberryguru »

✔ Лучший ответ — сформирован автоматически
Manuelriere писал(а):это не лотерея, это невыполненный чеклист
легко говорить, когда preupgrade отчет уже видел. там портянка на пару сотен строк, часть пунктов inhibitor, остальное шум, и сторонний kmod от какого-нибудь касперского или агента бэкапа в этом шуме теряется на раз. формально да, написано. фактически leapp до сих пор не умеет сказать человеческим языком: вот эти три строчки сделай обязательно, остальное потом. так что и чеклист, и лотерея одновременно
👍2 ❤️ 🔥2 😄1 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Linux и системное администрирование»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость