Открыто

Введение в соревновательный Data Science | Kaggle. 2025 [Stepik] [Алерон Миленькин, Иван Александров, Вольнов Сергей]

Тема в разделе "Курсы по программированию", создана пользователем dimkavoront, 8 мар 2023.

Основной список: 25 участников

Резервный список: 14 участников

  1. 8 мар 2023
    #1
    dimkavoront
    dimkavoront ДолжникДолжник

    Складчина: Введение в соревновательный Data Science | Kaggle. 2025 [Stepik] [Алерон Миленькин, Иван Александров, Вольнов Сергей]

    2025-12-04_233350.png

    Введение в соревновательный Data Science | Kaggle
    Разбираемся в тонкостях соревновательного анализа данных. Прокачиваемся в построении моделей машинного обучения с максимальной точностью. Минимум теории, максимум практики для победы в чемпионатах.
    Курс стал победителем в номинации "Прорыв Года" Stepik Awards 2023.

    Чему вы научитесь
    • Строить конкурентно-способные и стабильные модели машинного обучения с максимальным качеством, которые не шатает на привате.
    • Понимать практические методы из статистики, полезные для машинного обучения
    • Использовать обширные возможности платформы Kaggle
    • Применять наиболее эффективные техники ансамблирования, которые пригодятся не только в соревнованиях, но и в других сферах.
    • Реализовывать изученные техники на Python и пользоваться современными ML-фреймворками
    О курсе
    Что будет на курсе? Ты узнаешь об эффективных и хорошо зарекомендовавших себя техниках построения моделей машинного обучения. Мы расскажем, как правильно генерировать и фильтровать признаки, тюнить и валидировать модели, строить ансамбли и ускорять вычисления, а также другие часто применяемые на практике вещи вплоть до вычислений в облаках.
    В рамках курса будет 10 модулей, более 200 практических заданий на отработку материала, интервью с Kaggle Grand Masters, сильное комьюнити с заряженными участниками (20 из которых ужа заработали свои первые медали на Kaggle), и многое другое. Курс постоянно обновляется и дополняется!
    Лучших студентов снаряжаем сервером с несколькими GPU и большой оперативной памятью для участия в боевых чемпионатах.

    Чего не будет на курсе? Это крайне практический курс, направленный на применение ML в реальных задачах. Тут не будет теоретической/математической стороны машинного обучения. Не будем считать производные и писать линейные регрессии с нуля, а будем учиться использовать существующие инструменты, чтобы делать свои модели наиболее точными и эффективными. Решенную по ходу курса задачу на Kaggle, можно будет использовать в качестве портфолио для демонстрации будущим работодателям.

    Программа курса

    Введение.
    Что даст тебе этот курс?
    Суть соревновательного анализа данных.
    А с кем и где будем соревноваться в курсе?
    Генеративный AI ускорит тебя в 100 раз!

    Классические элементы анализа данных.
    Пишем и организуем код.
    Pandas. Забудь про циклы!
    Данные и визуализация. Куда двигаться?!
    Валидация и модели.

    Углубляемся в Feature Engineering.
    Pandas мощнее, чем ты думаешь!
    Генерируем новые признаки и увеличиваем точность.
    Фильтрация признаков
    Визуализация. Как понять, где модель косячит?
    Секретный гость (интервью с Solo Kaggle Grand Master).

    Тюнинг бустингов как искусство.
    Его бустейшество CatBoost.
    Его светлейшество LightGBM.
    Его экстримшество XGBoost.
    Бустинги. Практика.

    Выжимаем максимум из ML-моделей.
    Автоматическая генерация и фильтрация признаков.
    Не время блендить, давайте выжмем еще!

    Блендинг, cтекинг и другие техники дойти до 95%.
    Блендинг. Смешай и точность вырастет!
    Стекинг. Точность снова выросла, да ну на?!
    Автоматический блендинг и стекинг. Sklearn-Pipelines.

    Вспомогательные техники.
    Оптимизация памяти и ускорение вычислений.
    Парсинг внешних данных.

    Kaggle. Ящик инструментов для победы.
    Работа с платформой Kaggle и Kaggle API.
    Google Colab, Paper Space, Yandex Cloud.
    Работа в команде.

    Бонусные главы.
    А нейронки будут?!
    Продвинутый Feature Engineering
    Weigths & Biases

    Запрещённые техники, или Что там по привату?!
    Работа с метрикой. Пре-процессинг и пост-процессинг
    Пробиваем лидерборд
    Псевдолейблинг и semi-supervised learning

    Финиш курса и плюшки!
    Ну вот и всё. Что дальше?
    Полное Baseline-решение. Бей его!

    Дополнительные материалы
    Блендинг, стекинг и большие датасеты
    Взболтать, но не смешивать. Практика.

    Наши преподаватели
    - Алерон Миленькин
    IT предприниматель. ex-ML Team Lead в Dodo Brands. Преподаватель в МФТИ. Автор курса "Введение в соревновательный Data Science".
    - Иван Александров
    Data Scientist at Research Data Lab by red_mad_robot. Kaggle expert.
    В сфере IT около 5 лет, начинал с backend разработки. Ex аспирант, научный сотрудник НПО "ВОЛС". Преподаю в онлайн магистратуре "Наука о данных" МФТИ.
    - Вольнов Сергей
    Senior Data Scientist в Saola. До этого более полутора лет работал в Точка банке на позиции Middle Data Scientist. Автор курса "Введение в Соревновательный Data Science".
    Последнее обновление 02.12.2025

    Цена: 5250 руб.
    Скрытая ссылка
     
    Последнее редактирование модератором: 4 дек 2025
    1 человеку нравится это.
  2. Последние события

    1. MariaChe
      MariaChe участвует в складчине.
      14 апр 2026 в 16:18
    2. CaptainObviousness
      CaptainObviousness не участвует в складчине.
      26 мар 2026
    3. Rml999
      Rml999 участвует в складчине.
      12 янв 2026
    4. Magenta001
      Magenta001 участвует в складчине.
      9 янв 2026

    Последние важные события

    1. skladchik.com
      Цена составляет 5 250р.
      4 дек 2025
  3. Обсуждение
  4. 18 май 2025
    #2
    wildcad
    wildcad ЧКЧлен клуба
    а тема умерла? вроде много чего обещают на курсе.