Введение в соревновательный Data Science | Kaggle. 2025 [Stepik] [Алерон Миленькин, Иван Александров, Вольнов Сергей]

dimkavoront · 8 мар 2023

Складчина: Введение в соревновательный Data Science | Kaggle. 2025 [Stepik] [Алерон Миленькин, Иван Александров, Вольнов Сергей]

Введение в соревновательный Data Science | Kaggle
Разбираемся в тонкостях соревновательного анализа данных. Прокачиваемся в построении моделей машинного обучения с максимальной точностью. Минимум теории, максимум практики для победы в чемпионатах.
Курс стал победителем в номинации "Прорыв Года" Stepik Awards 2023.

Чему вы научитесь

Строить конкурентно-способные и стабильные модели машинного обучения с максимальным качеством, которые не шатает на привате.

Понимать практические методы из статистики, полезные для машинного обучения

Использовать обширные возможности платформы Kaggle

Применять наиболее эффективные техники ансамблирования, которые пригодятся не только в соревнованиях, но и в других сферах.

Реализовывать изученные техники на Python и пользоваться современными ML-фреймворками

О курсе
Что будет на курсе? Ты узнаешь об эффективных и хорошо зарекомендовавших себя техниках построения моделей машинного обучения. Мы расскажем, как правильно генерировать и фильтровать признаки, тюнить и валидировать модели, строить ансамбли и ускорять вычисления, а также другие часто применяемые на практике вещи вплоть до вычислений в облаках.
В рамках курса будет 10 модулей, более 200 практических заданий на отработку материала, интервью с Kaggle Grand Masters, сильное комьюнити с заряженными участниками (20 из которых ужа заработали свои первые медали на Kaggle), и многое другое. Курс постоянно обновляется и дополняется!
Лучших студентов снаряжаем сервером с несколькими GPU и большой оперативной памятью для участия в боевых чемпионатах.

Чего не будет на курсе? Это крайне практический курс, направленный на применение ML в реальных задачах. Тут не будет теоретической/математической стороны машинного обучения. Не будем считать производные и писать линейные регрессии с нуля, а будем учиться использовать существующие инструменты, чтобы делать свои модели наиболее точными и эффективными. Решенную по ходу курса задачу на Kaggle, можно будет использовать в качестве портфолио для демонстрации будущим работодателям.

Программа курса

Введение.
Что даст тебе этот курс?
Суть соревновательного анализа данных.
А с кем и где будем соревноваться в курсе?
Генеративный AI ускорит тебя в 100 раз!

Классические элементы анализа данных.
Пишем и организуем код.
Pandas. Забудь про циклы!
Данные и визуализация. Куда двигаться?!
Валидация и модели.

Углубляемся в Feature Engineering.
Pandas мощнее, чем ты думаешь!
Генерируем новые признаки и увеличиваем точность.
Фильтрация признаков
Визуализация. Как понять, где модель косячит?
Секретный гость (интервью с Solo Kaggle Grand Master).

Тюнинг бустингов как искусство.
Его бустейшество CatBoost.
Его светлейшество LightGBM.
Его экстримшество XGBoost.
Бустинги. Практика.

Выжимаем максимум из ML-моделей.
Автоматическая генерация и фильтрация признаков.
Не время блендить, давайте выжмем еще!

Блендинг, cтекинг и другие техники дойти до 95%.
Блендинг. Смешай и точность вырастет!
Стекинг. Точность снова выросла, да ну на?!
Автоматический блендинг и стекинг. Sklearn-Pipelines.

Вспомогательные техники.
Оптимизация памяти и ускорение вычислений.
Парсинг внешних данных.

Kaggle. Ящик инструментов для победы.
Работа с платформой Kaggle и Kaggle API.
Google Colab, Paper Space, Yandex Cloud.
Работа в команде.

Бонусные главы.
А нейронки будут?!
Продвинутый Feature Engineering
Weigths & Biases

Запрещённые техники, или Что там по привату?!
Работа с метрикой. Пре-процессинг и пост-процессинг
Пробиваем лидерборд
Псевдолейблинг и semi-supervised learning

Финиш курса и плюшки!
Ну вот и всё. Что дальше?
Полное Baseline-решение. Бей его!

Дополнительные материалы
Блендинг, стекинг и большие датасеты
Взболтать, но не смешивать. Практика.

Наши преподаватели
- Алерон Миленькин
IT предприниматель. ex-ML Team Lead в Dodo Brands. Преподаватель в МФТИ. Автор курса "Введение в соревновательный Data Science".
- Иван Александров
Data Scientist at Research Data Lab by red_mad_robot. Kaggle expert.
В сфере IT около 5 лет, начинал с backend разработки. Ex аспирант, научный сотрудник НПО "ВОЛС". Преподаю в онлайн магистратуре "Наука о данных" МФТИ.
- Вольнов Сергей
Senior Data Scientist в Saola. До этого более полутора лет работал в Точка банке на позиции Middle Data Scientist. Автор курса "Введение в Соревновательный Data Science".
Последнее обновление 02.12.2025

Цена: 5250 руб.
Скрытая ссылка

wildcad · 18 май 2025

а тема умерла? вроде много чего обещают на курсе.