Задачи: Разработка ETL процессов Sqoop; Разработка потоков обработки данных на PySpark; Создание пайплайнов в планировщике задач Oozie; Разработка систем контроля качества данных на Apache Griffin; Написание Bash скриптов; Обработка структурированных данных (XML/JSON) на Python/PySpark; Исправление багов и проблем функционала; Работа с системами контроля версий GIT/SVN.
Образование:
Высшее-специалитет, магистратура
Опыт:
3
Контакты:
Для просмотра контактов необходимо авторизоваться на сайте.