Доступно

Симулятор «SQL для анализа данных» [Simulative]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 19 май 2022.

Цена: 12 000р-95%
Взнос: 484р
100%

Основной список: 56 участников

Резервный список: 70 участников

Статус обсуждения:
Комментирование ограничено.
  1. 19 май 2022
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба

    Складчина: Симулятор «SQL для анализа данных» [Simulative]

    Это не курс. Это симулятор работы аналитика данных в реальной компании с элементами обучения. Вы будете считать retention и LTV, писать многоэтажные CTE и делать другие полезные для бизнеса штуки с помощью SQL.

    Цели симулятора

    1. Обучить не элементарным «SQL-запросам», а полезным фишкам, экосистеме и продакшен-левел коду
    2. Научить писать запросы, нужные бизнесу. Вы не будете изучать котиков — вы будете считать LTV, делать сложные агрегации и ad-hoc
    3. Погрузить в среду. Вы будете работать с профессиональными инструментами — PostgreSQL, DBeaver, MySQL, Power BI и шедулерами
    Чем предстоит заниматься
    • Писать многочисленные ad-hoc SQL запросы: сбор и валидация email-адресов, расчет статистик пользовательской активности и многое другое
    • Собирать когорты, анализировать retention, LTV, CR и другие продуктовые метрики с помощью high-level SQL-запросов
    • Автоматизировать импорт/экспорт данных на Windows/Linux сервере с помощью SQL + Python + psycopg2 + cron
    Программа обучения
    Симулятор состоит из 13 глав.

    Каждая глава — это теория + практические задачи + отработка навыков на бизнесовых кейсах.

    Вы будете анализировать пользовательский опыт платформы IT Resume, работать с продакшен-левел инструментами и решать реальные кейсы с интересным сюжетом.

    1. Вы познакомитесь с базами данных, поймете отличие БД от СУБД, обсудите важность нормализации на конкретных кейсах и прочие «основы основ».

      В конце - тест для проверки знаний.

    2. Вы научитесь подключаться к удаленной базе 4 разными способами, разберете типы данных и поймете отличие DCL от DML.

      Для закрепления знаний - тест.

    3. В этой главе вы научитесь писать базовые SQL-запросы — но далеко не самые простые. Также вы освоите функции обработки текста, даты, времени, кастинга, крутые функции COALESCE/NULLIF, логические операторы, CASE и многое другое. Сортировка, горизонтальная фильтрация, поиск по шаблону, регулярки — все это в этой главе.

      Для закрепления — домашнее задание.

      Хоть вы только начали путь, вы уже будете решать реальные продуктовые задачи. Например:
      1. Соберете и подготовите базу для email-рассылок
      2. Посмотрите на пользователей в разрезе дат и погрузитесь в обработку даты-времени
      3. Произведете валидацию номеров телефонов
      4. Расклассифицируете задачи на платформе по группам в зависимости от определенного признака
    4. В этой главе мы расскажем про основные продуктовые метрики, которые пригодятся вам абсолютно в любом проекте — будь то мобильное приложение или офлайн-магазин. Например, в следующих главах вы воспользуетесь этими знаниями для аналитики платформы.

      Для отработки и закрепления результатов — тест + расчётные задания.

    5. Вы научитесь группировать таблицу по определенным признакам и использовать агрегатные функции: от простейших AVG и MIN до экзотических mode WITHIN GROUP.

      Для отработки навыков — домашнее задание.

      После этого вы снова отработаете полученные знания на реальных кейсах. Например:
      1. Оцените распределение активности пользователей по часам/дням
      2. Сколько в среднем пользователь делает попыток для решения 1 задачи? А сколько людей решают задачи с первой попытки? А каково значение моды?
      3. Оцените MAU/WAU/DAU
      4. Посчитаете эффективность реферальной программы
      5. Посмотрите на то, как пользователи платформы тратят и копят CodeCoins
    6. Только умея LEFT/RIGHT/FULL/SELF/CROSS/INNER JOIN, мы можем получить действительно что-то полезное и осмысленное. Именно эти конструкции вы и освоите в данной главе.

      Для закрепления — домашнее задание.

      После этого вы продолжите анализировать user experience платформы. Например:
      1. Посмотрите, кто не только решает задачи, но и участвует в других активностях
      2. Однозначно скажете – от какой компании сколько пользователей пришло и как они себя вели
      3. Оцените распределение решенных задач и тестов по тегам и категориям
    7. Редко решение задачи можно уложить в один короткий запрос. В этой главе вы научитесь писать сложные вложенные подзапросы и выносить все это аккуратно в CTE. А еще обсудим код-стайл и смежные вопросы.

      Для закрепления — традиционная домашка.

      После этого закрепите все на практике. Например:
      1. Посчитаете RETENTION/CR и подумаем над тем, как удержать пользователей
      2. Углубитесь в то, как пользователи решают задачи и проведете глубокое исследование
      3. Соберете всю статистику о пользователях в одном месте, чтобы показать ее рекрутерам
    8. Разберетесь, в чем мощь window functions, причем здесь вообще окна и как избежать фатальных ошибок при использовании UNBOUNDED FOLLOWING/CURRENT ROW. Также научитесь считать накопительный итог и не только - используя агрегатные функции, как оконные.

      Для отработки — полноценное домашнее задание.

      Затем вы снова вернетесь к работе над аналитикой платформы. Например:
      1. Снова рассмотрите вопрос retention и LTV, но под новым соусом
      2. Оцените динамику активностей, найдете участки спада и роста
      3. Посчитаете текущий баланс накопительным итогом по всем пользователям и найдете аномалии
    9. В этой главе вы сами запроектируете базу для нового проекта, построите ее схему со связями и напишите все DDL-скрипты для создания. А в конце — развернете ее и в облаке, и на локальной машине! А чтобы базу можно было потестить — наполните ее фейковыми данными (так частенько делают в продакшене) с помощью специальных сервисов.

      Будете использовать: draw.io, DBeaver, MySQL + Workbench, сервисы-фейкеры.

    10. В этой главе вы научитесь работать с psycopg2, mysql.connector, узнаете про шаблон проектирования Singleton, научитесь регистрировать собственные типы данных, работать с базой через Python, разберете ошибки типа Authentication plugin ′caching_sha2_password′ cannot be loaded и многое другое.

      Для отработки — полноценное домашнее задание.

      В результате вы получите:
      1. несколько готовых классов для подключения к основным СУБД, которые вы можете использовать потом на работе
      2. написанные Python-скрипты для экспорта-импорта данных из базы
      3. проект по выгрузке данных из базы и дальнейшей обработке в Pandas
    11. В этой главе вы научитесь автоматизировать типовые задачи: например, бэкапы и инсерты. Делать это будем с помощью cron, шедулера и Python-скриптов. На закуску — Airflow.

      На выходе вы будете иметь скрипты и инструкции для автоматизации задач с помощью cron, а также готовый проект с Python-кодом для ежедневного инсерта данных в БД.

    12. SQL тесно связан с аналитикой и датавизом. В этой главе вы будете подключать базу к Power BI и Redash, чтобы строить ad-hoc отчеты и дашборды. Затронем тему подключения по ssh, построения дашбордов и поиска полезных инсайтов.

      В результате этой главы вы решите реальное тестовое задание в крупную Edtech компанию на позицию аналитика.

    13. В конце — небольшая ретроспектива всех ваших наработок, а также наши советы относительно тестовых заданий, best practices и дальнейшего развития. Полезные материалы, ссылки и непрошенные советы — то, что нужно в конце такого обучения.

      Но на самом деле, это не конец, а только начало интересного пути :)
    Продажник:
    Скрытая ссылка
     
    6 пользователям это понравилось.
  2. Последние события

    1. androkotey
      androkotey оставил отзыв "Отлично".
      26 окт 2022
    2. Zen1th
      Zen1th оставил отзыв "Ужасно".
      1 окт 2022
    3. skladchik.com
      Складчина доступна.
      24 сен 2022
    4. GalinN
      GalinN участвует в складчине.
      18 сен 2022

    Последние важные события

    1. skladchik.com
      Складчина доступна.
      24 сен 2022
    2. skladchik.com
      Взнос в складчине составляет 242р.
      27 май 2022
    3. skladchik.com
      Складчина активна.
      27 май 2022
    4. skladchik.com
      Сбор взносов начинается 27.05.2022.
      25 май 2022
  3. Отзывы участников

    3/5,
    • 5/5,
      Работой организатора доволен
      Лучший курс по SQL из тех, что проходил. Но явно лучше не с нуля, иначе будет сложновато без обратной связи от преподов.
      26 окт 2022
      1 человеку нравится это.
    • 1/5,
      Работой организатора недоволен
      Курс плохо структурирован, практичной пользы максимум 10%. Позиционируют себя как симулятор, хотя от симулятора лишь банальные имейлы от коллег. Реальных продуктовых задач - минимум.
      1 окт 2022
      7 пользователям это понравилось.
  4. Обсуждение
  5. 23 май 2022
    #2
    kolovorat
    kolovorat ЧКЧлен клуба
    И как собираетесь доступ к тренажеру, всем участникам предоставить?
     
    1 человеку нравится это.
  6. 23 май 2022
    #3
    influte
    influte ЧКЧлен клуба
    Во-первых орга здесь нет еще, во-вторых никак доступ к тренажеру не предоставишь, так же как в складчинах Яндекс Практикума - все материалы без тренажера.
     
  7. 25 май 2022
    #4
    kolovorat
    kolovorat ЧКЧлен клуба
    Какие материалы?
    В заголовке складчины же написано - Это не курс. Это симулятор работы аналитика данных в реальной компании с элементами обучения. Вы будете считать retention и LTV, писать многоэтажные CTE и делать другие полезные для бизнеса штуки с помощью SQL.
     
  8. 25 май 2022
    #5
    Организатор
    Организатор ОргОрганизатор
    Это текст с продажника, как минимум скрипты, видео, задания и текстовые материалы еще плюс возможно база, где можно тренироваться. хз, что там будет, для этого складчик и нужен.
     
  9. 12 июн 2022
    #6
    petroivan
    petroivan ЧКЧлен клуба
    хоть с небольшим опозданием, но оплатил. Просьба выдать материал.
    Спасибо
     
  10. 22 июн 2022
    #7
    ivano92
    ivano92 ДолжникДолжник
    Подскажите, пожалуйста, когда по складчине будет дальше развитие, а то вроде нужную сумму собрали?. Как я понимаю нет организатора?
     
  11. 22 июн 2022
    #8
    ZibukaZavr
    ZibukaZavr ЧКЧлен клуба
    Не может быть...
     
  12. 22 июн 2022
    #9
    Zen1th
    Zen1th ЧКЧлен клуба
    орг есть. все должно быть предоставлено. наберитесь терпения
     
  13. 22 июн 2022
    #10
    ivano92
    ivano92 ДолжникДолжник
    Обозначте, пожалуйста, приблизительно сколько дней ждать.
     
  14. 23 июн 2022
    #11
    mozus
    mozus ЧКЧлен клуба
    Еще один симулятор по SQL вышел от достойного автора Скрытая ссылка
     
  15. 11 июл 2022
    #12
    qwest
    qwest ЧКЧлен клуба
    Подскажите, когда планируется выдача доступа? Спасибо
     
    3 пользователям это понравилось.
  16. 20 июл 2022
    #13
    elsabedor
    elsabedor ЧКЧлен клуба
    На сайте указано, что время прохождения симулятора около полутора месяца. Уже около 40 дней прошло с момента открытия складчины, так что вероятно недели две придется еще подождать.
     
  17. 21 июл 2022
    #14
    Alex820202
    Alex820202 ДолжникДолжник
    Блин, читайте правила клуба - запрещено обсуждать ход складчины. Уж члены клуба, это должны знать...
     
  18. 4 сен 2022
    #15
    Zen1th
    Zen1th ЧКЧлен клуба
    ОРГ ты бы мог дать какую то обратную связь?
     
    3 пользователям это понравилось.
  19. 4 сен 2022
    #16
    Организатор
    Организатор ОргОрганизатор
    смысл таких вопросов? Всё будет как только курс закончится)
     
    1 человеку нравится это.
Статус обсуждения:
Комментирование ограничено.