Коротко о причинах инцидента и восстановлении работы сервисов
В течение нескольких часов по всему миру наблюдались серьёзные перебои в работе сайтов и онлайн-сервисов. По данным Cloudflare, причиной стал плановый апдейт конфигурации, который проявил скрытую ошибку в сервисе, лежащем в основе антибот-функций. Компания подчёркивает: это не была атака и не авария дата-центров.
Что именно произошло
- Сбой затронул значимую долю трафика, проходящего через сеть Cloudflare.
- Неполадки продолжались порядка трёх часов, после чего началось поэтапное восстановление.
- Первопричина — изменение конфигурации, проявившее дефект в подсистеме защиты от ботов.
Официальный комментарий
«Мы подвели наших клиентов и значимую часть Интернета. Скрытая ошибка в сервисе антибот-функций проявилась после
планового изменения конфигурации и привела к ухудшению работы сети. Это неприемлемо — мы уже работаем над тем,
чтобы такое не повторилось».
— технический директор Cloudflare Дейн Кнехт
Контекст и фон
Инцидент стал третьим заметным сбоем за последний месяц в экосистеме крупных провайдеров: ранее сообщалось о проблемах в регионе AWS US-East-1 (сбой DNS), а затем — о перебое в Microsoft Azure. Концентрация трафика и сервисов в облаках усиливает эффект подобных событий для конечных пользователей.
Источник: iXBT
