Трохи більше ніж через тиждень після масштабного збою в Amazon Web Services (AWS), внаслідок якого низка веб-сайтів і хмарних служб була виведена з ладу, хмарна платформа Microsoft Azure зазнала збоїв у роботі служби, що вплинуло на її служби та додатки клієнтів, включаючи протокол зв’язку, який запускає Dynamics 365 Contact Center.
Згідно зі сторінкою стану Azure, між 15:45 UTC 29 жовтня та 00:05 UTC 30 жовтня зміна конфігурації спричинила збої вузлів у Azure Front Door (AFD), глобальній хмарній службі Microsoft, яка обробляє доставку та маршрутизацію вмісту.
Ціла низка служб Azure зазнавала затримок, тайм-аутів і помилок, у тому числі Azure Communication Services (ACS). Канали обміну голосовими та SMS-повідомленнями в Dynamics 365 Contact Center побудовано на основі ACS, що дає змогу організаціям надавати номери телефонів, увімкнути голосові дзвінки та керувати можливостями SMS безпосередньо через ACS.
Збій порушив обслуговування клієнтів у багатьох галузях, включаючи авіакомпанії, роздрібну торгівлю та ігри, усі з яких використовують Azure для своїх серверних операцій, включаючи системи торгових точок, портали клієнтів і мобільні додатки.
Alaska та Hawaiian Airlines, які нещодавно об’єдналися, повідомили, що Azure розміщує кілька їхніх ключових послуг, у тому числі веб-сайти, що означало, що клієнти не могли забронювати або зареєструватися на рейси онлайн.
Мандрівникам, які не змогли зареєструватися, порадили звернутися до агента аеропорту за посадковим талоном і запланувати додатковий час у терміналі, оскільки були довгі черги.
«Наші команди швидко працювали над створенням нашої резервної інфраструктури, щоб дозволити нашим гостям бронювати та реєструватися на свої рейси онлайн, мінімізуючи збої в роботі», — заявили в Alaska Airlines. Авіакомпанія додала, що відновить уражені системи онлайн, «щойно Microsoft вирішить проблему зі свого боку».
Аеропорт Хітроу також повідомив про проблеми зі своїм веб-сайтом, тоді як роздрібні торговці, такі як Starbucks, Costco та Kroger, зазнали перебоїв у роботі своїх веб-сайтів і мобільних додатків, про що свідчать стрибки звітів на сайті моніторингу збоїв DownDetector.
Власні служби Microsoft не були захищені, оскільки її клієнти не могли ввійти в Xbox Live, Minecraft та інші ігрові платформи Microsoft, а доступ до інструментів підвищення продуктивності 365, таких як Outlook, Teams і SharePoint, був недоступний для корпоративних користувачів, а також для споживачів.
Час збою був дивовижним, враховуючи те, що Microsoft звітувала про свої квартальні прибутки, а веб-сайт для зв’язків з інвесторами був закритий перед дзвінком аналітиків.
Компанія повідомила про 40-відсоткове зростання своїх доходів від Azure, що вказує на те, наскільки глибоко вкорінена хмарна інфраструктура в галузях.
Збій слугував нагадуванням про критичну роль, яку відіграє хмарна інфраструктура в сучасному наданні послуг клієнтам, і про ризики централізованих залежностей.
Послідовні збої виявляють системну залежність від хмарних гігантів
У той час як збій AWS виник із серверів Amazon у Північній Вірджинії, торкнувшись східного узбережжя США та частини Західної Європи, збій Azure поширився далі, причому Downdetector вказує на збої в частинах Азії, а також у США та Європі.
За попередніми повідомленнями, збій був глобальним. Вівек Додд, Генеральний директор Skillcastсказав CX Today:
«Черговий збій, що стався так близько після нещодавнього збою в AWS, підкреслює, наскільки економіка стала залежною від основних постачальників технологій».
«Коли ці великі платформи перебувають у стані простою, хвильові ефекти виникають миттєво й широко поширюються в галузях — порушуються фінансові системи, логістичні мережі та роздрібні операції».
Оскільки цифрова трансформація переносить більше корпоративних систем у хмару, багато компаній намагаються створити плани стійкості, щоб не відставати від зростаючих ризиків.
«Припущення про те, що провідні хмарні платформи завжди будуть доступні, призвело до того, що деякі підприємства можуть бути піддані ризику, коли трапляються збої», — сказав Додд.
Підприємствам необхідно проактивно впроваджувати операційну стійкість і управління ризиками третіх сторін як основні пріоритети для пом’якшення ризиків, а не реагувати на них і розглядати їх як запізнілі думки.
«Побудова справжньої стійкості вимагає не лише технологічної надлишковості; це вимагає передбачення, планування та навчання», — сказав Додд.
Один зі способів зробити це — уникнути повної залежності від хмарної інфраструктури, використовуючи гібридні підходи, щоб їхні системи мали надлишковість.
«Організації повинні впроваджувати гібридні або багатохмарні моделі, такі як диверсифікація між постачальниками, щоб уникнути надмірної залежності від одного постачальника, створити чіткі протоколи реагування на кризу та інвестувати в дотримання вимог і стійкість у масштабах всієї компанії, щоб ефективно вирішувати такі ситуації», — пояснив Додд.
Тому що коли інфраструктура сторонніх розробників виходить з ладу, саме підприємство страждає від впливу на клієнтський досвід.
«Такі інциденти служать потужним нагадуванням про те, що стійкість — це не лише технології, а й захист довіри, продуктивності та впевненості клієнтів у цифровій економіці».
