Отключение AWS напоминает нам, что судьба Интернета находится в руках нескольких

Отключение AWS напоминает нам, что судьба Интернета находится в руках нескольких

В то время мы управляем сайтами с личных и корпоративных серверов, обычно расположенных в наших домах и офисах. По мере роста Интернета мы строили серверные стойки, локации и центры обработки данных. Однако со временем компании и службы любого размера переложили жертвы серверов на третьи стороны, или, как их теперь называют, облачные службы.

Логика прочная. Мы живем в домах, но не строим дома физически. Акт обслуживания и разработки сайтов не является существенным для предоставляемых ими услуг. Ну, это как если бы без серверов не было сервиса. Но сервер работает через API, скрипты и другие алгоритмы и программы, разработанные компанией для доставки таких вещей, как ваш поток Netflix, данные вашей учетной записи кошелька Coinbase или следующего потенциального пользователя Tinder.

Способность облачных сервисов, таких как Amazon Web Services (AWS) и Microsoft Azure, при условии, что вы достаточно заплатите, быстро масштабироваться (или сокращаться, если необходимо), делает их разумным бизнес-решением для любого предприятия любого размера. Вы никогда не знаете, например, когда малый бизнес станет крупной компанией и когда он должен обслуживать одновременно десять пользователей на сайте пятисот.

Это очевидное преимущество облачных веб-сервисов. Обратной стороной является то, что произошло на этой неделе с AWS.

Отказ AWS

Огромные куски AWS рухнули во вторник днем. Панель мониторинга AWS Health дает хороший обзор почти 7-часового простоя. На заднем плане, по крайней мере, согласно Amazon, была атака, взлом или атака отказа в обслуживании (DDoS). Это была пара API, которые плохо себя вели в индустрии массовых услуг.

Мы все живем в страхе перед серьезной DDoS-атакой или атакой, которая нарушит эти системы (фактически, любую систему, от которой мы зависим) и поставит их на колени, но редко делает это. Когда Cloudflare вышел из строя в две тысячи девятнадцатом году, изначально считалось, что это была атака на их систему. Однако мы быстро обнаружили, что это была просто плохая программная реализация, в первую очередь человеческая ошибка.

Даже с отключением AWS в том, что Amazon называет «регионом US-EAST-1», последствия были значительными и повсеместными. Это ощущалось на платформах, ориентированных на потребителя, таких как Disney + и, естественно, Amazon.com и некоторые сервисы Alexa.

Когда я опубликовал текущую запись в Твиттере, я оценил, как много людей практически бьют себя головами по лицу и восклицают: «Значит, я выбыл!»

Мне пришло в голову, что многие из этих пользователей понятия не имели, что AWS стоит за их предпочтительными пользовательскими и бизнес-системами. Кроме того, точных цифр нет ни у кого (кроме Amazon), но в недавних отчетах утверждается, что AWS обслуживает миллионы людей. Microsoft Azure также сообщает о миллионах пользователей и о большинстве из пятисот компаний из списка Fortune. У Google Cloud есть такие громкие имена, как Verizon, NewsCorp и Fb.

Что-то нужно изменить?

Широкое использование облачных сервисов - неплохая вещь, хотя отсутствие информации может привести к путанице и появлению отпечатков пальцев, как, например, у человека, который не мог перемещать команды в своей системе и получал многочисленные сообщения об ошибках, обвиняя свои системы в адрес внешнего дистрибьютора. . как AWS).

Сочетание широкого охвата облачных систем и общего отсутствия информации в реальном времени и обратной связи для клиентов, находящихся в неблагоприятном положении, вызывает беспокойство. Масштабы любого отключения электроэнергии, безусловно, вызывают беспокойство, особенно если учесть, что следующее неизбежно.

Прошли те времена, когда у кого-то выходила из строя серверная стойка и сайт выходил из строя. Теперь у нас есть небольшие сбои в крупных облачных системах, таких как AWS, Axure и Cloudflare, которые вызывают цунами отключений.

Кто-то в Твиттере спросил: «Что случилось с масштабированием и балансировкой нагрузки?» «Это хороший вопрос. AWS построена на сотнях отдельных кластеров облачных серверов и предлагает множество возможностей резервирования, масштабирования и балансировки нагрузки. И опять же, иногда этого недостаточно. Сложные системы могут работать неправильно и особенно уязвимы для обновлений программного обеспечения, которые могут конфликтовать. с устаревшим кодом Из-за того, что все эти облачные сервисы, включая AWS, мощные и распределенные, они по-прежнему программируются, запускаются и обслуживаются подверженными ошибкам людьми.

Итак, как мы можем лучше информировать общественность и, что более важно, защитить AWS, Azure, Cloudflare и другие от подобных сбоев, которые не только приводят к неактивным сайтам и службам, но и к потере миллионов людей? Американские доллары?

Может быть, пора сделать шаг назад и изучить целостность и безопасность облачных систем точно так же, как мы контролируем водные системы. Кажется, что ни одна из них не слишком велика, чтобы выйти из строя, но все они слишком важны, чтобы их можно было повредить, нарушить или потерять.