О роли
Описание вакансии
О компании
- Команда GigaChat Reasoning, которая даёт модели суперсилу размышлять.
Обязанности
- Улучшать качество работы GigaChat Reasoning на русском и английском языках;
- Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг;
- Тестировать новые Loss-функции и подходы к обучению;
- Помогать выводить в прод всё, что мы обучим;
- Постоянно держаться up-to-date со свежими статьями.
Требования
- Опыт в online RL и хорошие теоретические знания;
- Уверенное владение Python, PyTorch;
- Знание базовых алгоритмов и математики;
- Знания в DL, опыт обучения простых и больших моделей;
- Опыт обучения моделей для продакшена;
- Понимание текущего состояния эволюции больших LLM'ов;
- Будет плюсом наличие публикаций.
Условия
- Ежегодный пересмотр зарплаты, годовая премия;
- Корпоративный спортзал и зоны отдыха;
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
- Ипотека выгоднее до 7% для каждого сотрудника;
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
- Вознаграждение за рекомендацию друзей в команду Сбера.
Стек и навыки
С чем работаем