О компании
Мы являемся ведущим участником децентрализованной AI-сети Gonka, используя высокопроизводительную GPU-инфраструктуру для максимизации вознаграждений от майнинга.
Обязанности
- Реализация продвинутых оптимизаций вывода для максимизации веса майнинга.
- Настройка конфигураций Docker для различных моделей GPU.
- Разработка стратегий оптимизации, балансирующих пропускную способность и качество.
- Создание и поддержка пользовательских образов Docker, оптимизированных для конкретных архитектур GPU.
- Проектирование и внедрение систем для стабильного и масштабируемого майнинга.
- Миграция кода Python и реализаций VLLM на новые образы VLLM.
Требования
- Опыт оптимизации больших языковых моделей.
- Понимание архитектур трансформеров и механизмов внимания.
- Уверенное владение PyTorch, CUDA и техниками оптимизации GPU.
- Опыт работы с Docker и управлением нагрузкой GPU.
Условия
- Возможность работать с передовой AI-инфраструктурой.
- Высокие бонусы, основанные на достигнутых улучшениях веса.
- Гибкий удаленный график работы.