О компании:
Мы команда, которая индексирует интернет и превращает разрозненные страницы в структурированную товарную базу, состоящую из десятков миллиардов документов, в условиях десятков тысяч обновлений в секунду.
Обязанности:
- Индексация и краулинг: реализовывать стратегии планирования и приоритизации обхода интернета;
- Хранение и обработка данных: развивать пайплайны хранения и обработки данных на базе YTsaurus;
- Интеграция алгоритмов и ML: внедрять ML-модели в продакшен-пайплайны.
Требования:
- Разрабатывали высоконагруженные сервисы и работали с большими данными;
- Уверенно владеете C++;
- Понимаете сетевые взаимодействия;
- Умеете писать надёжный и производительный код.
Будет плюсом, если вы:
- Разрабатывали краулеры или поисковые системы;
- Интегрировали ML-модели в продакшен;
- Понимаете алгоритмы ранжирования и обработки данных.