21 марта 2026, 10:27

День SRE на конференции Teх.Диалог

2 мин

Все, кто так или иначе занимается сопровождением и обслуживанием высоконагруженных систем сталкиваются с отказами. Просто потому что если взять среднее время наработки на отказ условной виртуалки в 500 дней, то при наличии тысячи виртуальных серверов чисто математически сегодня у вас должны упасть два и это если просто ничего не трогать. А мы трогаем. Релизы, работы, рост данных, внешние факторы (такие как подъем нагрузки и отказы внешних сервисов, телеграм, ты читаешь?) стабильности не добавляют.

Как со всем этим жить, подробно и по шагам расскажем на втором дне конференции Teх.Диалог. Собрали для Вас основные лекции и мастер классы по обеспечению и управлению стабильностью:

Начнем как обычно с мониторинга, просто потому что ехать на машине с заклеенной старыми газетами лобовухой некоторое количество непродуктивно. Поэтому для начала погрузимся в принципы наблюдаемости систем, пройдемся по основным метрикам бизнеса, сервисов и инфры, зацепим трейсы, логи и поиск девиаций в них

Продолжим большим блоком работы с инцидентами и расчетом доступности. Поговорим о том, чем инцидент отличается от алерта, как быстро определить степень влияния и организовать работу на инциденте, экономя драгоценные секунды. Что делать когда починили, как и зачем писать постмортем, когда инцидент считается завершенным и сколько минут писать в черную книжечку прода, если по как-ой причине легли не полностью.

Третий блок посвящен техническим приемам работы с доступностью: чем проектирование сложных высокодоступных систем отличается от проектирования обычных сервисов, нужно ли заморачиваться отказоустойчивостью на этапе MVP, какие методы используются для повышения доступности приложения для пользователя в инфраструктуре и коде и как готовится к подъему нагрузки заранее, что бы не падать в самый ответственный момент.

По результату получился плотный, хорошо дополняющий доклады первого дня мастер-класс с практическими примерами и веселыми историями, особенно для тех, кто в эти истории не попадал. Приходите учиться на чужих ошибках и перенимать опыт, который мы для вас кропотливо собирали многие годы работы с высокими нагрузками на сотнях и тысячах инцидентов.

Билеты по ссылке https://techdialogos.ru/

Увидимся!

Мониторинг инцидент-менеджмент архитектура нагрузочное тестирование производительность высоконагруженные проекты

Читают сейчас

6 часов назад

Глава Microsoft объяснил, почему ИИ не обесценит людей

Гендиректор Microsoft Сатья Наделла опубликовал в X программную статью о будущем компаний в экономике, которой управляет ИИ. Его основной вывод звучит так: чем мощнее становится искусственный интеллек

8 часов назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

8 часов назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

9 часов назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

11 часов назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения