Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
Рейтинг: 20.7% · 1 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
Рассказываю, пока горит. Контора сидела на CentOS 7 до последнего, EOL был ещё в июне 2024, но руководству было пофиг, работает же. В этом году прилетело сразу два требования: ИБ хочет реестровый дистрибутив на контурах с персданными, остальное надо хотя бы перевести на поддерживаемое. Решили так: РЕД ОС 8 туда, где госданные, AlmaLinux 9 на всё остальное.
План был красивый: elevate/leapp для in-place апгрейда альмы, ред ос ставим начисто. По факту elevate упал на 7 машинах из 18 из-за стороннего kmod от агента бэкапа, который забыли снести. На двух машинах после апгрейда не поднялась сеть, старые ifcfg скрипты девятка через NetworkManager читает уже криво, у меня bond просто исчез. А вишенка: биллинг на php 5.6 (да, я знаю), который тащил пакеты из remi под centos 7 и после апгрейда умер целиком. Узнали об этом в субботу утром от клиентов.
Откатывался со снапшотов, благо виртуалки. Две недели разгребал. Вывод: in-place апгрейд через два мажорных релиза это лотерея, проще катить чистые машины ансиблом и переносить сервисы по одному. Кто проходил подобное, как вы вообще выбивали у руководства время на нормальную миграцию, а не вот это вот всё?
План был красивый: elevate/leapp для in-place апгрейда альмы, ред ос ставим начисто. По факту elevate упал на 7 машинах из 18 из-за стороннего kmod от агента бэкапа, который забыли снести. На двух машинах после апгрейда не поднялась сеть, старые ifcfg скрипты девятка через NetworkManager читает уже криво, у меня bond просто исчез. А вишенка: биллинг на php 5.6 (да, я знаю), который тащил пакеты из remi под centos 7 и после апгрейда умер целиком. Узнали об этом в субботу утром от клиентов.
Откатывался со снапшотов, благо виртуалки. Две недели разгребал. Вывод: in-place апгрейд через два мажорных релиза это лотерея, проще катить чистые машины ансиблом и переносить сервисы по одному. Кто проходил подобное, как вы вообще выбивали у руководства время на нормальную миграцию, а не вот это вот всё?
✔ Лучший ответ сформирован автоматически — raspberryguru
Manuelriere писал(а):это не лотерея, это невыполненный чеклист легко говорить, когда preupgrade отчет уже видел. там портянка на пару сотен строк, часть пунктов inhibitor, остальное шум, и сторонний kmod от какого-нибудь касперского или агента бэкапа в этом шуме теряется на раз. формально да, написано. фактически leapp до сих пор не умеет сказать человеческим языком: вот эти три строчки сделай об…
- regexlover
- Сообщения: 18
- Зарегистрирован: 21 май 2026, 11:59
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
@katykat, Про РЕД ОС потом отдельно расскажи, как оно после альмы в эксплуатации. Мы сейчас выбираем между ним и Астрой для аттестуемого контура, ИБ топит за Астру, потому что сертификатов больше, а мне ред ос милее, он ближе к привычной RHEL-вселенной и меньше сюрпризов в пакетной базе.
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
как выбивали время у руководства. Никак. У руководства никогда нет денег на миграцию, но всегда находятся деньги на тушение пожара. Твоя суббота с лежащим биллингом это и есть бюджет на миграцию, просто согласованный задним числом, хах
- Manuelriere
- Сообщения: 58
- Зарегистрирован: 13 май 2026, 17:46
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
у elevate в документации прямым текстом написано: снести сторонние kmod перед апгрейдом, там даже preupgrade check на это есть. Не в обиду, но это не лотерея, это невыполненный чеклист. Хотя про ifcfg согласен, мина знатная, у меня после перехода на keyfiles тоже полночи сеть по консоли поднимал.
- Yuliyazhelman
- Сообщения: 8
- Зарегистрирован: 11 май 2026, 05:12
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
@Manuelriere, а почему альма, а не рокки? У нас этот холивар уже месяц идёт и не кончается. Хотя по мне после 9.5 альма чуть отошла от bug-for-bug совместимости и для 95 процентов задач разницы вообще ноль, кидайте монетку и работайте.
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
перевозил похожий парк прошлой осенью, около 50 машин. после третьего leapp плюнул и дальше катал чистую альму киксстартом плюс ансибл, по времени вышло быстрее, чем разгребать сюрпризы in-place. апгрейд на месте оправдан только там, где конфиг руками намазан за десять лет и его никто не помнит. и да, ifcfg это боль, у нас половина скриптов мониторинга парсила вывод ifconfig, которого в 9 уже просто нет. всплыло, конечно же, ночью
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
@Yuliyazhelman, мы после ухода вима разделили: виртуалки бэкапит Proxmox Backup Server, он бесплатный, а на железных машинах restic в s3-совместимое хранилище. на 40 машин выходит сильно дешевле миллиона, по сути платишь только за сторадж. Киберпротект щупали: рабочий, но консоль из 2012 и ценник ровно как ты описываешь. единственное, что реально потеряли против вима, это гранулярное восстановление из гостевых баз, но оно нам было нужно раз в год
- raspberryguru
- Сообщения: 14
- Зарегистрирован: 11 май 2026, 05:05
Re: Перевозил 40 серверов с CentOS 7 и чуть не уволился, история одного факапа
✔ Лучший ответ — сформирован автоматически
легко говорить, когда preupgrade отчет уже видел. там портянка на пару сотен строк, часть пунктов inhibitor, остальное шум, и сторонний kmod от какого-нибудь касперского или агента бэкапа в этом шуме теряется на раз. формально да, написано. фактически leapp до сих пор не умеет сказать человеческим языком: вот эти три строчки сделай обязательно, остальное потом. так что и чеклист, и лотерея одновременноManuelriere писал(а):это не лотерея, это невыполненный чеклист
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Подписал оффер, уволился, а за два дня до выхода оффер отозвали. Что делать?
10 ответов · 9 просмотров
-
- Подключил 12 MCP-серверов — Claude Code стал заметно тупее. Кто как чистит контекст?
5 ответов · 8 просмотров
-
- Отозвали оффер за 4 дня до выхода, со старого места уже уволился. Оффер в РФ вообще что-то значит?
5 ответов · 6 просмотров
-
- Ушёл в саббатикал на полгода, сдался через три месяца. История о том, как я не умею отдыхать
6 ответов · 5 просмотров
-
-
- Уехал на выходные, а автополив на ESP32 устроил потоп. история одного провала
8 ответов · 5 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость