Открыто

MLOps для разработки и мониторинга моделей [Яндекс Практикум]

Тема в разделе "Нейросети и искусственный интеллект", создана пользователем Топикстартер, 29 апр 2026.

Основной список: 16 участников

  1. 29 апр 2026
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба

    Складчина: MLOps для разработки и мониторинга моделей [Яндекс Практикум]

    upload_2026-4-29_22-29-50.png

    Это курс для специалистов с опытом, которые хотят профессионально вырасти

    Нужно знать основы SQL и объектно-ориентированного программирования, уметь использовать Python для решения ML-задач, быть знакомым с проектированием веб-сервисов на Flask, FastAPI или Django, работать в Git на уровне открытого PR и с простыми пайплайнами по обработке данных в оркестраторах общего применения Airflow или Prefect
    • Специалисты в области Data Science и Machine Learning
      Разберётесь в ключевых практиках и инструментах MLOps, чтобы разворачивать и управлять ML-моделями в продакшн-среде
    • ML-инженеры и специалисты по DevOps
      Структурируете знания и освоите подход к управлению жизненным циклом ML-моделей: автоматизируете развёртывание, настройку мониторинга и обновление моделей в продакшене
    • Инженеры данных
      Погрузитесь в новую предметную область и выйдете за рамки классических ETL-процессов: научитесь организовывать и сопровождать ML-модели в продакшене
    Через 5 месяцев вы сможете
    • Оценивать зрелость ML-проекта при помощи фреймворка MLOps-зрелости
    • Развёртывать ML-модели в продакшене
    • Настраивать и поддерживать CI/CD-процессы для ML, чтобы автоматизировать обновление и интеграцию моделей
    • Разрабатывать MLOps-архитектуру, адаптированную под конкретный кейс
    • Выбирать подходящий способ деплоя в зависимости от бизнес-требований
    • Работать в облачной среде и управлять ML-инфраструктурой при помощи Yandex Cloud
    • Автоматизировать жизненный цикл ML-модели: предобработку данных, эксперименты, развёртывание и мониторинг
    • Обеспечивать надёжность и контроль качества моделей с помощью версионирования, тестирования, мониторинга данных и метрик
    • Взаимодействовать с другими специалистами, создавая комплексные ML-решения, готовые к масштабированию
    Освоите стек технологий, который соответствует современным требованиям MLOps
    • Python
    • Git
    • Docker
    • Docker Compose
    • FastAPI
    • MLflow
    • ClearML
    • S3
    • Yandex Cloud
    • Prometheus Stack
    • Evidently
    • Great Expectations
    • Airflow
    • PostgreSQL
    • Linux
    • GitLab CI
    • CI/CD
    • NFS
    • Kserve
    Программа:
    1. Введение в MLOps
    2. Практики разработки
    3. DevOps- и CI/CD-практики
    4. Контейнеризация и облачное окружение
    5. Качество и версионирование данных
    6. Отслеживание экспериментов, управление ML-моделями и их хранение
    7. Оркестрация и ML-пайплайны
    8. Развёртывание ML-моделей
    9. Мониторинг и обратная связь

    1. Введение в MLOps


    Карта профессионального развития
    Освежите знания по MLOps и роли MLOps в жизненном цикле ML-проекта. Рассмотрите модели зрелости от Microsoft, Google и GigaOm. Оцените свои проекты. Составите карту своего профессионального развития с учётом навыков, которые получите на курсе

    Проект
    • Составите карту ваших навыков в MLOps и определите траекторию профессионального развития
    Инструменты и технологии
    • MLOps
    • Жизненный цикл
    • Модели зрелости
    • Карта профессионального развития
    Содержание
    1. Роль MLOps в жизненном цикле ML-проекта
      Поймёте роль MLOps в жизненном цикле ML-модели: от подготовки данных до продакшна и мониторинга. Узнаете, как связаны этапы разработки и эксплуатации, какую ценность MLOps приносит бизнесу — скорость, стабильность, качество решений
    2. Зрелость MLOps и платформенный подход
      Изучите модели зрелости MLOps. Узнаете, как оценивать уровень проекта. Разберёте ключевые компоненты MLOps-платформ. Поймёте, как платформизация помогает стандартизировать процессы и ускорять разработку
    3. Профессия MLOps-инженера и карта развития
      Рассмотрите роль MLOps-инженера как специалиста на стыке Data Science, разработки и инфраструктуры. Определите зоны ответственности и ключевые навыки. Оцените свой текущий уровень компетенций и сформируете персональную траекторию развития
    2. Практики разработки

    Перейдёте от хаотичной разработки к созданию профессиональных и надёжных ML-решений, которые легко поддерживать

    Проект
    • Сделаете ревью кода для ML-проекта
    Инструменты и технологии
    • uv
    • Pylint/Ruff
    • mypy
    • PyTest
    • Docker
    • Docker Compose
    Содержание
    1. Управление зависимостями
      Настроите изолированное окружение с uv, изучите безопасное обновление библиотек и автоматизацию процессов
    2. Качество кода
      Научитесь применять автоформатирование, линтинг (PEP8) и статическую типизацию для повышения читаемости, предсказуемости и надёжности кода
    3. Промышленные ML-пайплайны
      Научитесь организовывать эксперименты, создавать масштабируемые и поддерживаемые решения
    4. Тестирование ML
      Напишете чистые, изолированные и воспроизводимые тесты для всех компонентов (данные, модели, логика) с использованием PyTest
    3. DevOps- и CI/CD-практики

    Научитесь внедрять DevOps-практики в MLOps: от теории ограничений и Linux-администрирования до построения CI/CD-пайплайнов для ML-приложений с контейнеризацией, деплоем на VM и управлением артефактами

    Проект
    • Создадите GitLab-пайплайн для линтинга, сборки и деплоя на VM
    Инструменты и технологии
    • GitLab CI
    • Docker
    • Docker Compose
    • S3
    • NFS
    • Linux
    • Systemd
    • Yandex Cloud
    Содержание
    1. Философия DevOps и MLOps
      Узнаете теорию ограничений и принципы бережливого производства. Поймёте, как находить и устранять узкие горлышки в ML-системах
    2. Инфраструктура для MLOps
      Освоите администрирование Linux-серверов: работу с Systemd, переменными окружения, сетевыми хранилищами (NFS) и облачными объектными хранилищами (S3)
    3. Непрерывная интеграция — CI
      Научитесь автоматизировать этапы линтинга кода, обучения моделей и сохранения артефактов (весов моделей) в S3 с помощью GitLab CI
    4. Непрерывное развёртывание — CD
      Настроите автоматический деплой Docker-контейнеров на удалённые виртуальные машины. Научитесь безопасно управлять секретами и использовать современные инструменты сборки образов
    4. Контейнеризация и облачное окружение

    Настроите облачное окружение с необходимыми инструментами в Yandex Cloud

    Проект
    • Сделаете ревью кода для ML-проекта
    Инструменты и технологии
    • Python
    • Docker
    • Docker Compose
    • Git
    • Yandex Cloud
    Содержание
    1. Знакомство с Docker
      Научитесь устанавливать Docker, создавать образы и управлять контейнерами. Освоите контейнеризацию ML-сервисов с оптимизацией (dockerignore, multistage build)
    2. Оркестрация сервисов
      Соберёте и научитесь управлять многосервисной инфраструктурой с помощью Docker Compose, а также диагностировать взаимодействия
    5. Качество и версионирование данных

    Научитесь проектировать data-пайплайны для ML, диагностировать проблемы данных (пропуски, дрифты), внедрять валидацию через Pandera/Great Expectations и версионировать датасеты с DVC для воспроизводимости

    Проект
    • Выявите Data Drift (метрики PSI, KS, библиотека Evidently), сравните исторические и текущие данные, опишете схемы (Pandera, Pydantic) для обнаружения ошибок типов, пропусков и выбросов. Также автоматизируете тесты качества и отчёты при помощи Great Expectations
    Инструменты и технологии
    • Pydantic
    • Great Expectations
    • ClearML
    Содержание
    1. Введение в data engineering для ML
      Изучите путь данных от источников до модели: типы хранилищ (объектные/табличные/файловые), стратегии инжеста, критерии выбора инфраструктуры под задачи ML
    2. Проблемы качества данных и метрики
      Научитесь распознавать ошибки данных (дубликаты, некорректные форматы, схематические несоответствия), рассчитывать метрики completeness/validity/uniqueness и анализировать их влияние на модели
    3. Data Drift и Schema Drift
      Поймёте различия между Data/Target/Concept/Schema Drift, сделаете ручное обнаружение дрифтов (PSI/KS-тесты), автоматизируете мониторинг с Evidently и интерпретируете отчёты
    6. Отслеживание экспериментов, управление ML-моделями и их хранение

    Освоите ключевые инструменты MLOps (MLflow и ClearML) и научитесь управлять полным жизненным циклом ML-проектов — от логирования экспериментов до реестра моделей, деплоя и оркестрации ресурсов

    Проект
    • Настроите ClearML: сервер, версионирование экспериментов, реестр моделей, S3-хранилище и управление агентами
    Инструменты и технологии
    • Python
    • MLflow
    • ClearML
    Содержание
    • MLflow
      Разберёте задачи, которые решает инструмент MLOps. Сравните возможности MLflow и ClearML. Научитесь фиксировать параметры и метрики экспериментов, отслеживать их результаты и сравнивать запуски между собой. Освоите реестр моделей и встроенный механизм развёртывания
    • ClearML
      Изучите принципы работы этой платформы. Научитесь отслеживать эксперименты и управлять версиями моделей. Разберёте развёртывание моделей и их обновление в ClearML
    • Оркестрация ресурсами ClearML
      Познакомитесь с концепцией агента ClearML и принципами распределённого выполнения задач. Поймёте, как организовать масштабируемый запуск экспериментов
    7. Оркестрация и ML-пайплайны

    Освоите полный цикл оркестрации ML: автоматизируете подготовку данных, эксперименты, обучение моделей и их деплой в продакшн с помощью промышленных инструментов

    Проект
    • Построите воспроизводимый ML-пайплайн для приложения
    Инструменты и технологии
    • Airflow
    • ClearML
    • Docker
    • Kubernetes
    • S3
    • Yandex Cloud
    Содержание
    1. Батч-оркестрация с Airflow
      Сможете описывать и планировать ETL-процессы с помощью DAG. Узнаете, как автоматизировать загрузку и обработку данных из S3
    2. Оркестрация ML-экспериментов в ClearML
      Научитесь создавать воспроизводимые ML-пайплайны для обучения, валидации и сравнения множества моделей с параллельным запуском экспериментов
    3. Развёртывание в Kubernetes с помощью Helm
      Поймёте основы Kubernetes. Разберётесь в управлении развёртыванием ML-сервисов с помощью Helm-чартов, стандартизацией и контролем версий инфраструктуры
    4. Распределённые вычисления и продакшн-деплой
      Настроите ClearML Agent в Kubernetes для распределённого выполнения задач. Автоматизируете процесс выбора лучшей модели и её деплоя в Serving
    5. Сравнительный анализ инструментов
      Изучите экосистему оркестраторов: Airflow, Mage, Prefect, Argo Workflows. Поймёте их сильные и слабые стороны в реальных проектах
    8. Развёртывание ML-моделей

    Спроектируете, развернёте и оптимизируете системы для пакетного и онлайн-инференса. Выберете подходящие инструменты и форматы моделей, чтобы обеспечить производительность и масштабируемость

    Проект
    • Развернёте ML-приложение в Kubernetes
    Инструменты и технологии
    • ClearML
    • Kubernetes
    • Kserve
    • ONNX
    • S3
    • GitLab Registry
    • Yandex Cloud
    Содержание
    1. Офлайн-инференс в ClearML
      Автоматизируете пакетные предсказания по расписанию с распределённой обработкой данных и управлением артефактами в S3
    2. Онлайн-инференс в Kubernetes
      Разработаете и задеплоите ML-сервис в k8s: используете Init-контейнеры и Secrets, обеспечите доступ к моделям из S3
    3. Оркестрация инференса с Kserve
      Создадите высокопроизводительный инференс-сервис с автоматическим масштабированием, мониторингом и интеграцией с объектными хранилищами
    4. Оптимизация моделей
      Конвертируете модели в форматы ONNX для ускорения предсказаний. Сравните производительность разных форматов
    9. Мониторинг и обратная связь

    Спроектируете и развернёте систему полного цикла мониторинга для ML-проектов. Будете отслеживать работоспособность инфраструктуры и качество моделей. Автоматизируете реакцию на инциденты.

    Проект
    • Построите систему полного цикла мониторинга для ML-приложения: от сбора метрик и визуализации в Grafana до настройки алертов и интеграции с CI/CD. Автоматизируете обновление моделей в продакшене
    Инструменты и технологии
    • Prometheus
    • Grafana
    • Loki
    • Evidently
    • Alertmanager
    • Yandex Cloud
    Содержание
    1. Инфраструктурный мониторинг
      Научитесь собирать системные метрики (CPU, RAM, GPU) и метрики приложений (latency, throughput) с помощью Prometheus. Создадите дашборды в Grafana для визуализации состояния системы.
    2. Централизованное логирование и алертинг
      Настроите сбор логов с помощью Loki, интегрируете их в Grafana. Создадите правила для автоматического оповещения о проблемах через Alertmanager.
    3. Мониторинг качества ML-моделей
      Научитесь отслеживать метрики качества и анализировать поведение моделей — изменения распределений признаков и предсказаний, data drift и concept drift. Рассмотрите библиотеку Evidently: от расчёта метрик до интеграции с системой мониторинга и настройки порогов алертов.
    4. Мониторинг в CI/CD и автоматизация реагирования
    5. Интегрируете проверки качества в пайплайн. Автоматизируете переобучение и деплой новых версий моделей при срабатывании алертов.

    Цена 140000 руб.
    Скрытая ссылка
     
    1 человеку нравится это.
  2. Последние события

    1. llmai
      llmai участвует в складчине.
      21 май 2026 в 23:46
    2. JCDenton
      JCDenton участвует в складчине.
      19 май 2026 в 16:21
    3. MarlonGando
      MarlonGando участвует в складчине.
      17 май 2026
    4. Квентин
      Квентин участвует в складчине.
      17 май 2026