технологии люди здоровье аномалия нео

Как "железная женщина" помогает "Яндекс Такси"

ОтказоустойчивостьДля обеспечения отказоустойчивости есть множество решений. Например, тестовые отключения дата-центров и искусственные нагрузки позволяют рассчитать необходимое количество "железа", дашборды и роботы мониторят здоровье системы в реальном времени, а координаторы и разработчики симулируют поломки в тестовой копии приложения, чтобы быть готовыми к реальным инцидентам.Как вы думаете, почему вся команда разработчиков встречает каждый Новый Год вместе в зуме?Чтобы пользователи в Новый год могли перемещаться между родственниками и друзьями, некоторые из разработчиков сидят не за праздничным столом, а за ноутбуками."Новый год я провожу за телефоном и компьютером.При этом обычно у нас есть передышка под бой курантов − за пару минут до и несколько мин после все замирает, в этот момент можно выдохнуть", - рассказал герой "Яндекс Такси" в "Антологии".Железная женщинаА вы знали, что разработчикам ночью звонит "железная женщина"?В "Яндекс Такси" ласково называют робота, который первым сообщает о том, что что-то случилось. "Когда что-то идет не так, нам звонит "железная женщина" − это робот, который быстро реагирует − звонок идет ключевым людям и текущим дежурным. - Объясняют создатели сериала. - Если автоматика замечает некоторые аномалии в метриках, она подает сигнал дежурным инженерам о том, что система не в порядке, и стоит обратить внимание, не сломалось ли что-то важное".После звонка от робота разработчики ищут причину сбоя и начинают изучать дашборды − тысячи графиков с метриками и различными показателями.

DMCA