знание языка SQL и опыт создания SQL-запросов к базам данных;
понимание общих принципов реляционных баз данных: таблица данных, первичный и внешний ключи, индексы, связи между таблицами;
базовые знания системы распределённых вычислений Apache Spark и базовые знания системы оркестрации процессов обработки данных Apache Airflow — будет преимуществом.