Вакансия: Lead Data Scientist
Зарплата: руб.
Форма занятости:
Полная занятость
Метод работы:
Полный рабочий день
Задачи: Наша команда занимается созданием инструментов и решений для внутренней безопасности на базе AI: разработка и развитие AI-агентов, запуск локальных инстансов LLM и их файнтюнинг. Наши планы имеют широкий спектр - начиная от разработки DL-моделей для скоринга, поведенческого моделирования и заканчивая AI-агентами. Сейчас мы ищем опытного Team Lead DS, обладающего глубокими знаниями в разработке AI-решений и опытом руководства командой специалистов в сфере анализа данных и машинного обучения (ML). Обязанности Разработка и реализация обучение DL-моделей классификации, кластеризации, прогнозирования, построение ансамблей моделей. Визуализация и интерпретации предикта моделей Разработка AI-агентов и мультиагентских систем, создание Retrieval Augmented Generation (RAG), Function Calling и пр. Управление проектированием и разработкой высоконагруженных мультиагентных систем. Управление жизненным циклом ML-моделей: проектирование, обучение, деплоймент, мониторинг производительности и оптимизацию процессов (MLOps). Дообучение и адаптация больших языковых моделей (LLM) под специфику бизнеса: файнтюнинг, применение подходов PEFT (LoRA, QLoRA, AdaLoRA), SFT. Подготовка и внедрение механизмов мониторинга качества моделей, улучшение метрик их эффективности. Поддержка действующих ML-моделей, их постоянное совершенствование и настройка на основе изменения внешних факторов и потребностей бизнеса. Управление DS-командой, взаимодействие с владельцами продуктов и другими командами Требования Опыт работы в области машинного обучения от 5 лет. Опыт работы с Deep Learning в CV, NLP, RL и других областях. Глубокие знания архитектур DL-нейронных сетей: CNN (ResNet, EfficientNet), RNN/LSTM/GRU, Transformers (BERT, GPT, ViT), GAN, Diffusion Models. Владение различными методами обучения нейронных сетей: Incremental learning, Self-Supervised Learning, Contrastive Learning и т.п. Экспертное понимание алгоритмов оптимизации (SGD с Momentum, Adam, AdamW, RMSProp, LAMB и пр.), знание продвинутых стратегий обучения: Learning Rate Scheduling (Cosine Annealing, Cyclical LR, Warmup), Gradient Clipping, Mixed Precision Training (FP16/BF16). Опыт работы с методами нормализации: Batch Normalization, Layer Normalization, Group Normalization, RMSNorm, AdaLN. Свободное владение PyTorch на уровне тензоров, самостоятельная реализация NLP-моделей, Трансформеров, Аттеншен-слоев и подобного через тензоры, а не только использование готовых библиотек с HuggingFace. Свободное владение классическим ML: линейная/логистическая регрессия, SVM, Random Forest, Gradient Boosting (XGBoost/LightGBM), k-NN, Naive Bayes, PCA, k-means, DBSCAN, GMM, HMM. Опыт успешного создания и развертывания AI-агентов с использование фреймвороков GigaChain, LangChain или аналогичных инструментариях. Экспертные знания техник Prompt Engineering, структурированных выходов и использования, вызова инструментов (Function Calling). Практический опыт в реализации Retrieval Augmented Generation (RAG) и понимание преимуществ данного метода. Обучение и файнтюнинг NLP моделей (SSL, SFT, PEFT): BERT, RoBERTa, XLNet, LLaMA), в том числе и самостоятельная разработка обучения на PyTorch. Опыт настройки и эксплуатации локальных инсталляций LLM и понимание различий между ними (LLaMA, Qwen, DeepSeek и др.). Навык командной работы и способность эффективно взаимодействовать с кросс-функциональными группами разработчиков, аналитиков и инженеров. Владение инструментами CI/CD, облачными инфраструктурами и контейнеризацией приложений Преимуществом будет знание и опыт работы в рамках фреймворка Scrum. Высокая продуктивность и умение быстро осваивать новые направления и подходы. Способность брать ответственность за принятые решения и стремление к постоянному развитию профессиональных навыков. Используемые технологии: Backend: Python, Spring Framework (IoC/DI, beans), Hibernate, REST Data: Postgres, Hadoop, ElasticSearch, Ignite ETL: Spark, Scala, Python, AirFlow, Zeppelin, Kafka CI/CD: Docker, OpenShift/K8s, Jenkins, Ansible, Nexus, BitBucket Условия Гибридный формат работы (Кутузовский проспект 32) Официальное оформление по Трудовому кодексу РФ. Полностью белая зарплата плюс ежегодная премия. Возможность профессионального роста и корпоративного обучения. Корпоративное медицинское страхование и дополнительные льготы сотрудникам. Программы поддержки здоровья семьи сотрудника. Дополнительные выплаты в экстренных жизненных ситуациях. Привилегированные условия кредитования. Специальные скидки и акции от партнёров компании (спортивные занятия, страховка, путешествия).
Образование:
Не указано
Контакты:
Для просмотра контактов необходимо авторизоваться на сайте.
Войти