Интегрировать готовые LLM‑решения в продукты и сервисы компании (через API, в бэкенд‑часть, в пайплайны обработки данных).
Оценивать качество ответов моделей с использованием автоматических метрик (BLEU, ROUGE, MMLU) и участвовать в организации human eval.
Участвовать в обеспечении безопасности и фильтрации генерируемого контента (настройка базовых guardrails).
Работать с RAG‑системами: помогать в индексации данных; выполнять запросы к векторным базам данных; участвовать в оптимизации поиска и генерации под руководством старших специалистов.
Взаимодействовать с продуктовой и ML‑командами, обсуждать технические решения.
Оптимизировать производительность инференса на базовом уровне (настройка batching, кэширование простых результатов).
При необходимости работать с готовыми мультимодальными решениями (текст, изображения, документы).
Выполнять дообучение (fine‑tuning) готовых LLM по готовым пайплайнам и методикам.
Требования
Высшее образование (IT, техническое, математическое).
Уверенное владение Python и SQL.
Хорошие знания в области: теории вероятностей и математической статистики; базовых алгоритмов машинного обучения (ML); NLP‑алгоритмов (классификация текста, токенизация, векторные представления).
Понимание принципов работы LLM, базовых сценариев их использования и дообучения.
Опыт деплоя ML‑решений (Docker, базовые сценарии в Kubernetes или облачных платформах).
Опыт работы с: векторными базами данных (выполнение запросов, понимание структуры индексов); фреймворками LangChain или LlamaIndex (базовое использование); методами оценки LLM (понимание BLEU, ROUGE и их ограничений).