Доступно

Онлайн-конференция Data Science [Datastart]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 4 окт 2020.

Цена: 790р-78%
Взнос: 166р
100%

Основной список: 18 участников

Резервный список: 4 участников

Статус обсуждения:
Комментирование ограничено.
  1. 4 окт 2020
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба
    Онлайн-конференция Data Science [Datastart]

    2020-10-04_192039.jpg


    1. Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики.

    Дмитрий Ветров Профессор-исследователь НИУ ВШЭ (Факультет компьютерных наук), глава Лаборатории машинного обучения, SAIC MOSCOW.

    За последние годы в глубинных нейронных сетях был обнаружен ряд необычных эффектов (двойной спуск, связность мод, "минные поля" в рельефе функции потерь, и др.), показавших, что сообщество плохо понимает, что происходит в процессе обучения нейронных сетей. В ходе доклада мы попробуем увязать ряд эффектов в единую гипотезу и обсудим результаты экспериментов, которые косвенно ее подтверждают.

    2. Инфраструктура извлечения факторов в проде

    Михаил Трофимов ML Engineer в Praxis Pioneering

    Часто при разработке продукта возникает несколько команд, реализующих ML в проде. У каждой стоит задача подсчета факторов, сбора сэмплов, обучения моделей, выкатка моделей в прод, доставка факторов в прод, синхронизация оффлайна и онлайна. Зачастую, каждая команда решает эти задачи независимо, что приводит в конечном итоге к замедлению разработки. В своем докладе я расскажу, как общая инфрастуктура факторов може ускорить разработку, зачем это вообще надо и какие проблемы возникают при ее построении.

    3. «Питонись на отличненько»

    Михаил СвешниковML Architect в Zyfra

    Питон известен своим низким порогом входа и на нем действительно очень просто писать код. Однако это не значит, что на нем просто писать ХОРОШИЙ код. Я расскажу, что же это за зверь такой – хороший код на питоне, а так же покажу полезные приемы, которые помогут вам проще и быстрее писать на питоне и вообще поднимут ваше питон кунг-фу на новый уровень. Доклад будет интересен и тем, кто только собирается учить питон, и тем кто уже в познании питона настолько преисполнился, будто бы уже 100 триллионов миллиардов лет пишет код на триллионах и триллионах таких же языков.

    4. Новинки CatBoost: поддержка эмбеддингов, обучение на SPARK и это еще не всё!

    Станислав Кириллов Руководитель группы ML систем Яндекса

    Как многим известно, градиентный бустинг на решающих деревьях остается SoTA на задачах, представимых в виде таблиц с признаками разной природы. До недавних пор CatBoost поддерживал 3 типа значений в колонках таких таблиц - вещественные признаки, категориальные и тексты.
    Сегодня мы хотим презентовать возможность обучения на эмбеддингах объектов - вещественных векторах, показывающих положение объекта в каком-то семантическом пространстве.
    Например, классическими примером эмбеддингов для текстов является word2vec, более новым - эмбеддинги трансформеров (BERT, GPT, etc). Мы расскажем о том, как именно CatBoost работает с такими векторами и как их использование может повысить качество ваших моделей.
    Вторая важная новость, о которой мы расскажем - поддержка обучения на SPARK кластерах. Мы покажем, как реализована поддержка SPARK и как ей воспользоваться.
    Ну и, конечно, это еще не все классные новости - еще мы расскажем о новых ускорениях и улучшениях, которые произошли с CatBoost за последние полгода.

    5. Инструменты визуализиации в NLP: от графов знаний до BERT

    Валентин Малых Senior Research Scientist в Noah’s Ark Lab

    Кажется, что нет более далекой области от визуализации, чем обработка текстов. Но на самом деле визуализации и тут могут во многом помочь. Я расскажу про работу с графами знаний, а также про то, какие можно получить знания изучая паттерны внимания модели BERT

    6. “Классическое” машинное обучение на табличных данных

    Александр Фонарев Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор

    В последние годы прикладное машинное обучение всё больше разделяется на два основных блока. Первый и наиболее хайповый — deep learning для обработки изображений, текста, звука и т. п. Второй, более старый, но не менее важный для бизнеса — “классический” ml для задач со табличными (структурированными) данными, использующийся для предсказания временных рядов, построения рекомендательных систем, предсказания поломок оборудования и многих других задач. В докладе мы погрузимся во второй блок: обсудим алгоритмы работы со структурированными данным, типизацию задач в этой области, практические кейсы, особенности индустрии сегодня и её развитие завтра.

    7. Эмбеддинги графов без учителя

    Антон Цицулин Аспирант университета Бонна, студент-исследователь в Google

    В последние годы всё больше ML пайплайнов строится на эмбеддингах – вещественных векторах довольно малой размерности, отражающие семантические свойства объектов. Мы довольно хорошо научились извлекать их из текстов, картинок, звука, но для графов доступных коробочных решений пока нет. Графы – хитрый вид данных, который возникает, когда нам даны только связи разных объектов между собой. Например, дружба или подписки в соцсетях, покупки товаров и другие действия пользователей – лишь одни из примеров отношений, которые удобно моделировать графами. Я расскажу, как получать эмбеддинги для графов, про графовые нейросети и то, как их обучать без учителя.

    8. Что такое "быстрый код"?

    Николай Марков Principal Architect в компании Aligned Research Group

    Какие именно особенности железа и кода заставляют его выполняться быстрее и эффективнее решать задачу? Стоит ли овчинка выделки? В докладе мы поговорим о том, как именно достигается высокая скорость выполнения кода, поковыряем распределенные вычисления, JIT, железки и векторизацию.


    9. Как устроен умный робот, улучшающий колл-центры Яндекс

    Татьяна Савельева Head of unstructured data analysis в Yandex.Taxi

    В своем докладе расскажу про наш продукт для автоматизации и улучшения коллцентров. Как автоматизировать 80% первой линии поддержки так, чтобы робот был неотличим от человека, как понять какой текст лучше присылать пользователю, как раздавать промокодыс большей пользой для клиента и многое другое.

    10. Почему бизнес не хочет внедрять современные технологии?

    Евгений Лимаренко CIO группа компаний Gulliver&Co

    Знакомая ситуация: приходишь в компанию или к коллегам в Коммерческий департамент, рассказываешь о крутом решении которую с парнями придумал и даже собрал MVP, а они смотрят, киваю головой и отказываются? Я расскажу вам, почему так происходит, как мыслят сотрудники бизнес подразделений и что нужно сделать, а что делать не надо, чтобы они хотели с вами работать.

    11. Open Source In the Wild

    Максим Кочуров Инженер-исследователь в NTechLab

    Все из нас (ну точно многие) пользуются библиотеками Numpy, Pandas, sklearn и так далее. Мир опен сорса очень огромен, там просиходят большие (и неочень) события, свои местечковые конференции, принимаются решения, которые влияют на нашу разработку.
    Однако знакомы с этой "кухней" далеко не все. Стандарты разработки многих продуктов обычно высоки. Кажется, что попасть в опен сорс сложно или почти невозможно. Не понятно с чего начать. Куда писать? Куда коммитить и как это делать? А вообще, зачем оно вообще нужно, вливаться в этот опен сорс, это же работа за бесплатно?
    Другие проблемы, которые уже несколько уровнем выше, возникают и куда более серьезны для развития проекта. Как взаимодействовать с пользователями? Как развивать комьюнити? Как добиваться узнаваемости и расширять пользовательскую базу?
    Проблемы взаимодействия с другими проектами тоже не остаются в стороне. Это бывают отношения пользователь-проект или проект-проект. В каждом из случаев есть нюансы. Как повлиять на развитие проекта? Как добавить недостающую фичу? Как поправить багу в любимой библиотеке? И самое главное, почему все так долго, и можно ли побыстрее?
    В опен сорс я попал со студенческой скамьи на наивном энтузиазме, но это продолжает переворачивать жизнь по сей день. Я постараюсь ответить на перечисленные вопросы опираясь на свой опыт, ретроспективные выводы спустя несколько лет участия в нескольких крупных проектах.

    12. Сколько стоит неэффективный Data Science или чему учить команду DS?

    Михаил Рожков Creator Machine Learning REPA

    Применение Data Science (DS) в бизнесе обычно связывают с тем value, которое смогут принести модели после их внедрение в процесс или продукт. При этом часто упускают из виду, что работа DS команды это сложный процесс, который требует значительных ресурсов и компетенций команды. В докладе обсудим, как можно оценить эффект от внедрения инструментов автоматизации и инженерных практик в Data Science. Доклад поможет компаниям найти точки роста DS команд и приоритезировать программы обучения и развития.

    13. Рабочий Вариант: как большие данные меняют мир массового найма

    Алексей Романов Expert Data Scientist в BigData МТС

    Искусственный интеллект в массовом найме — очень модная тема, и бизнес плотоядно облизывается, глядя на перспективы анализа больших данных в этой области.
    Однако с точки зрения Data Science работа в HR очень специфична: люди не тексты и не картинки, они капризны и часто непредсказуемы.
    В своём докладе я дам общий обзор комплекса DS-задач, которые возникают в области массового найма, и разберу более пристально наиболее каверзные из них

    14. Метрики в DS-проектах

    Алексей Могильников ML Lead в Сбербанке, Chief Methodologist в LeanDS

    Прикладное машинное обучение должно нести ценность бизнесу. В момент разработки модели не ясно как можно оценить потенциальную пользу модели и выбрать ожидаемые значения метрик на кросс-валидации или отложенной выборке такие, чтобы разработка модели имела смысл и ценность её была ощутима. В докладе будет показан подход к решению этой задачи и будет продемонстрировано как можно рассчитывать ценность, которую модель приносит бизнесу.

    Тариф - Онлайн трансляция + видеозаписи двух потоков
    Онлайн-участие
    Видеозаписи двух потоков конференции
    Презентации всех спикеров конференции
    Бонус: видеозаписи Конференции от 30/06/2020 в подарок

    Цена - 790 руб

    Продажник
     
    Последнее редактирование модератором: 12 окт 2023
  2. Последние события

    1. skladchik.com
      Складчина доступна.
      24 окт 2020
    2. Кадрушка
      Кадрушка участвует в складчине.
      23 окт 2020
    3. sungridmail
      sungridmail участвует в складчине.
      21 окт 2020
    4. Mtv Gru
      Mtv Gru участвует в складчине.
      20 окт 2020

    Последние важные события

    1. skladchik.com
      Складчина доступна.
      24 окт 2020
    2. skladchik.com
      Взнос в складчине составляет 83р.
      20 окт 2020
    3. skladchik.com
      Складчина активна.
      20 окт 2020
    4. skladchik.com
      Сбор взносов начинается 20.10.2020.
      17 окт 2020
  3. Обсуждение
  4. 17 окт 2020
    #2
    ZtaZ55
    ZtaZ55 ЧКЧлен клуба
    Цена указана, как за запись одного потока, а описание выдачи, как за запись с двух потоков. По итогу приобретается технический и бизнес потоки или же только технический?
     
  5. 17 окт 2020
    #3
    Организатор
    Организатор ОргОрганизатор
    будет два потока, в описании же все указано
     
    1 человеку нравится это.
  6. 17 окт 2020
    #4
    ZtaZ55
    ZtaZ55 ЧКЧлен клуба
    Решил уточнить, так как стоимость на продажнике за два потока 990, а 790 за один, вот и затесались сомнения. Спасибо за ответ!
     
  7. 17 окт 2020
    #5
    Организатор
    Организатор ОргОрганизатор
    цена со временем может меняться, поэтому всегда надо писать тариф и давать нормальное описание на что конкретно собираемся, тогда и вопросов не будет
     
Статус обсуждения:
Комментирование ограничено.