Группа компаний Top Selection занимается продуктовой разработкой и привлечением специалистов на проектную работу для рынка России.
Обязанности
Развертывание и настройка экспортеров (node_exporter, postgres_exporter, blackbox_exporter, cAdvisor, kube-state-metrics).
Написание сложных PromQL-запросов (histogram_quantile, predict_linear, rate).
Создание параметризованных дашбордов в Grafana с переменными и аннотациями алертов.
Разработка кастомных HTTP-экспортеров на Go для сбора метрик из очередей сообщений (Kafka/RabbitMQ), планировщиков задач, SCADA/Modbus/OPC UA и SNMP-устройств (принтеры, сканеры) с использованием библиотеки prometheus/client_golang.
Настройка Alertmanager: маршрутизация алертов, inhibition и silences для плановых работ, интеграция с BMC Remedy и мессенджером (webhook).
Мониторинг Kubernetes (ноды, поды, контейнеры) через kube-state-metrics и cAdvisor.
Настройка алертов на состояния CrashLoopBackOff, OOMKilled, NotReady.
Написание unit-тестов для правил алертинга (promtool test rules) и создание скрипты имитации метрик (Python/Go) для валидации порогов и эскалации.
Конфигурирование таймеров (for), группировки и повторных уведомлений в Alertmanager в соответствии с заданными параметрами.