Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
Рейтинг: 52.3% · 11 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
Вчера Cloudflare лежал около 3 часов из-за факапа с конфигом в их дата-плейне, и снова выяснилось что куча крупных сервисов завязана на одного провайдера. У нас отвалились вебхуки и капча, клиенты звонят. Как вы строите резерв чтобы один CDN не ронял весь прод?
✔ Лучший ответ сформирован автоматически — tor1
docker13 писал(а):альтернатив масштаба нет, поэтому все молча сидят и молятся вот это и бесит. Разбить монополию CDN технически нереально, это инфраструктура которую строили 15 лет. Регуляторы максимум обяжут отчеты по аптайму публиковать. Нам от этого ни тепло ни холодно, прод все равно сами резервируем.
Re: Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
никак если честно. Все говорят про мультиклауд и резервный CDN, а на практике это удвоение стоимости и сложности, и в итоге твой второй провайдер тоже на каком-нибудь общем бэкбоне лежит. Вчера и те кто на Fastly мигрировал тоже частично страдали.
Re: Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
@rust_sre, у нас две зоны, основной трафик через Cloudflare, на случай факапа DNS переключаем на прямые origin через резервный домен. Хелсчек на сторонке, если cf не отвечает 60 сек, скрипт меняет А запись на балансер в нашем облаке. Вчера отработало, но без капчи и waf сидели голые часа 2, ддосеры этим воспользовались сразу.
Re: Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
а TTL какой стоит на записи? Если 3600 то твой failover бесполезен, провайдеры и резолверы старый ип будут отдавать еще час. Мы ставили 60 сек TTL специально под такие переключения, но тогда нагрузка на DNS растет.sabaza писал(а):если cf не отвечает 60 сек, скрипт меняет А запись
Re: Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
вообще это философский вопрос. Централизация дает удобство и дешевизну но создает единые точки отказа на весь интернет. Cloudflare обслуживает дикую долю трафика, любой их чих и ложатся тысячи сайтов разом. Это системный риск, но альтернатив масштаба нет, поэтому все молча сидят и молятся.
Re: Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
@sabaza, из СНГ реалий, у кого прод в рф а cf не всегда стабильно работает из за блокировок и замедлений, давно держим Selectel CDN или нгенникс как резерв. Не так удобно с настройками waf, зато не зависим от того что там у клаудфлары в калифорнии сломалось.
Re: Cloudflare лег на 3 часа и положил пол интернета, опять single point of failure
✔ Лучший ответ — сформирован автоматически
вот это и бесит. Разбить монополию CDN технически нереально, это инфраструктура которую строили 15 лет. Регуляторы максимум обяжут отчеты по аптайму публиковать. Нам от этого ни тепло ни холодно, прод все равно сами резервируем.docker13 писал(а):альтернатив масштаба нет, поэтому все молча сидят и молятся
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Cloudflare R2 vs AWS S3 — кто реально съехал из-за egress? Делитесь опытом
12 ответов · 743 просмотров
-
-
- Как безопасно открыть сервисы наружу: Cloudflare Tunnel, Tailscale или проброс портов?
10 ответов · 497 просмотров
-
-
-
- Остался на даче без интернета и понял, что разучился писать код руками. У вас так же?
5 ответов · 7 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость