Задачи: Наша команда отвечает за качество моделей Text-to-speech в GigaChat – той части нейросети, которая занимается звуком. Сейчас мы ищем сотрудников, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами. Обязанности 60% data engineer, 25% developer, 15% ML писать пайплайны обработки аудио/видео данных подготовка датасетов для обучения и дообучения llm интегрироваться с ml/llm пайплайнами, бэкендом внедрять новые решения/фреймворки/тулы в части работы с данными улучшать надежность и масштабируемость дата процессов инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио) поддержка хранилища данных. Требования python и алгоритмы на хорошем уровне + ООП опыт с multithreading и multiprocess опыт разработки продакшн-сервисов и дата-пайплайнов понимание жизненного цикла LLM понимание подходов к контролю качества данных. S3 (важно), dvc. Условия гибридный или удаленный формат работы (из Москвы) ежегодный пересмотр зарплаты и годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека для сотрудников выгоднее до 7% бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
Образование:
Не указано
Контакты:
Для просмотра контактов необходимо авторизоваться на сайте.