отказоустойчивость

Всё работает ровно до того момента, когда ложится единственная точка отказа, и тогда начинается разбор полётов. Здесь обсуждают реальные инциденты: трёхчасовое падение Cloudflare, утянувшее пол-интернета, девять часов даунтайма из-за сэкономленных 19к на реплике Postgres и потерянного жирного клиента, схемы пережить отказ целого ДЦ в Hetzner на бюджет 300 евро. Темы про репликацию, failover, мультирегион и трезвую оценку, за что реально стоит платить. Полезно тем, кто проектирует инфраструктуру и не хочет узнавать про SPOF в день аварии.

3 тем, 20 ответов, 12 просмотров · все теги

Похожие теги: PostgreSQL 2hetzner 1помощь 1бэкапы 1yandex cloud 1сбой cloudflare 1cdn альтернативы 1