← Все вакансии/Сбер
Москва

SRE Team Lead

С
Сбер
О роли

Описание вакансии

Наша SRE команда создает надежную инфраструктуру и сопровождает highload системы для всех решений и умных устройств Салют.

У нас много классных сервисов, мы отвечаем за их надежность и доступность в режиме 24/7/365.

Ищем кандидата на роль тимлида команды сопровождения платформы Салют - сердце экосистемы умных устройств и сервисов.

Для нас важен сильный технический бэкграунд, опыт управления командой, позиция предполагает роль "играющего тренера".

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика ждите сообщение от него в Telegram, диалог займёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.

AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!

---

* Руководство распределенной командой SRE инженеров(мотивация, развитие, организация и контроль работы команды).  * Выполнение целей и достижение ключевых показателей в зоне ответственности команды.  * Организация внедрения и сопровождения высоконагруженных сервисов. * Создание промышленного и тестового окружения (VM(Linux), OpenShift, K8s) * Обеспечение доступности, надежности и производительности IT систем(24/7/365).  * Устранение инцидентов, анализ причин их возникновения.  * Применение методологии и инструментов DevOps в работе (BitBucket, Ansible, Jenkins, ArgoCD, GitLab) * Настройка и развитие систем мониторинга (Zabbix, Grafana, VictoriaMetrics) и анализа событий и логов (ELK) * Автоматизация рутинных задач (Python, ChatOps, AI) * Непрерывное изучение новых технологий, best practice и применение их на практике. * Взаимодействие с командами разработки и бизнесом.

---

* Опыт руководства и организации работы ИТ-команды (SRE, администраторы инфраструктуры, DevOps) * Сильные soft skills, ответственность за результат, аналитическое мышление, стрессоустойчивость.  * Опыт внедрения и сопровождения высоконагруженных ИТ-систем с высокими требованиями надежности и доступности.  * Уверенные знания Linux * Опыт работы с K8s/OpenShift * Опыт работы с системами мониторинга и логирования (Zabbix, Grafana, ELK) * Понимание сетевых протоколов, принципов построения высоконагруженных и отказоустойчивых систем * Опыт работы с Nginx, Kafka, ZooKeeper, Haproxy, S3,  * Опыт работы с базами данных PostgreSQL, MongoDB * Понимание принципов DevOps, опыт работы с основными инструментами.

Желательно владение/опыт работы со следующими технологиями:

* Навыки разработки и отладки на одном из языков Python, Java, С++ * Опыт автоматизации задач с использованием Python, ChatOps, AI-агентов * Понимание принципов IaC, опыт работы с Terraform * Интерес к теме AI, опыт создания AI-агентов

Стек и навыки

С чем работаем