Наша SRE команда создает надежную инфраструктуру и сопровождает highload системы для всех решений и умных устройств Салют.
У нас много классных сервисов, мы отвечаем за их надежность и доступность в режиме 24/7/365.
Ищем кандидата на роль тимлида команды сопровождения платформы Салют - сердце экосистемы умных устройств и сервисов.
Для нас важен сильный технический бэкграунд, опыт управления командой, позиция предполагает роль "играющего тренера".
Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика ждите сообщение от него в Telegram, диалог займёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.
AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!
---
* Руководство распределенной командой SRE инженеров(мотивация, развитие, организация и контроль работы команды). * Выполнение целей и достижение ключевых показателей в зоне ответственности команды. * Организация внедрения и сопровождения высоконагруженных сервисов. * Создание промышленного и тестового окружения (VM(Linux), OpenShift, K8s) * Обеспечение доступности, надежности и производительности IT систем(24/7/365). * Устранение инцидентов, анализ причин их возникновения. * Применение методологии и инструментов DevOps в работе (BitBucket, Ansible, Jenkins, ArgoCD, GitLab) * Настройка и развитие систем мониторинга (Zabbix, Grafana, VictoriaMetrics) и анализа событий и логов (ELK) * Автоматизация рутинных задач (Python, ChatOps, AI) * Непрерывное изучение новых технологий, best practice и применение их на практике. * Взаимодействие с командами разработки и бизнесом.
---
* Опыт руководства и организации работы ИТ-команды (SRE, администраторы инфраструктуры, DevOps) * Сильные soft skills, ответственность за результат, аналитическое мышление, стрессоустойчивость. * Опыт внедрения и сопровождения высоконагруженных ИТ-систем с высокими требованиями надежности и доступности. * Уверенные знания Linux * Опыт работы с K8s/OpenShift * Опыт работы с системами мониторинга и логирования (Zabbix, Grafana, ELK) * Понимание сетевых протоколов, принципов построения высоконагруженных и отказоустойчивых систем * Опыт работы с Nginx, Kafka, ZooKeeper, Haproxy, S3, * Опыт работы с базами данных PostgreSQL, MongoDB * Понимание принципов DevOps, опыт работы с основными инструментами.
Желательно владение/опыт работы со следующими технологиями:
* Навыки разработки и отладки на одном из языков Python, Java, С++ * Опыт автоматизации задач с использованием Python, ChatOps, AI-агентов * Понимание принципов IaC, опыт работы с Terraform * Интерес к теме AI, опыт создания AI-агентов