PyDaCon meetup в Mail.ru Group: 22 июня

2019-06-17 в 14:17, admin, рубрики: big data, machine learning, pydata, python, sql, Блог компании Mail.Ru Group

PyDaCon meetup в Mail.ru Group: 22 июня - 1

22 июня Mail.ru Group проводит совместный митап с организаторами конференции PyCon Russia и PyData Moscow meetup. Вас ждут 2 секции: доклады по Python, состав которого был сформирован на основе общего списка докладов к PyCon Russia и PyData-трек от PyData Moscow meetup. В программе мероприятия: keynote, технические доклады, викторина и много полезного общения.

Keynote: «Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda»
Петр Ермаков, Senior Data Scientist в Lamoda и Data Coach в DataGym

Больше двух лет назад я рассказывал о использовании jupyter на 100%. Но что, если вы не один? Как ужиться на одной машине 20 студентам, изучающим ML, или RND команде из 15? Готовые рецепты, рекомендации и собранные грабли.

Python-трек:
«SQL-боттлнеки: поиск и устранение узких мест при масштабировании»
Михаил Новиков, ведущий разработчик, Fasttrack (fstrk.io)

Вы начинаете новый проект. Устанавливаете веб-фреймворк, ORM-фреймворк, пишете модели, делаете запросы к БД. Всё идет хорошо. Потом к вам приходит 100 000 пользователей — и проект падает под нагрузкой. Ваши действия?

Такая ситуация была у нас полгода назад. Я расскажу, как мы нашли из нее выход, покажу наши подходы к поиску узких мест, сервисы, которые в этом помогают. И поясню, почему ванильный ORM — это зло.

«Сравнение технологий aiopg & asyncpg»
Алексей Фирсов, ведущий разработчик aio-libs/aiopg

Разберем, как работают две совершенно разные технологии aiopg & asyncpg — посмотрим, как они устроены. Что важно, мы не будем сравнивать скорость.

PyData Moscow meetup трек:
«Оформление пайплайна в NLP проекте»
Виталий Радченко, Data Scientist, YouScan

В докладе мы будем ориентироваться на лучшие мировые практики (AllenNLP) и свой собственный опыт. Расскажем, как нужно структурировать ваш пайплайн и особенности каждой его составляющей: как правильно оформлять входящие данные, итераторы по датасету, каким должен быть словарь, подготовка данных и др. Будут приведены примеры с реальных задач и показано, как это помогает в воспроизводимости и легкости дальнейшего использования.

«Стекаем и Блендим. Разбор популярных библиотек Python»
Дмитрий Буслов

В докладе мы расскажем про наиболее популярные библиотеки для формирования ансамблей. Начнем с простых ensemble в Sklearn-e, далее вручную соберем простейший стекинг в пару строчек кода, а после рассмотрим наиболее популярные библиотеки: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.

PyMC3 — Bayesian Statistical Modelling in Python, Максим Кочуров, PyMC Dev / Samsung AI / Skoltech

Байесовская статистика в последнее время стала обсуждаться в контексте глубокого обучения. К сожалению, это скрывает главное ее преимущество по сравнению со стандартными подходами машинного обучения. В отличие от black-box моделей, байесовский подход к моделированию white-box. White-box — это и хорошо, и плохо. От аналитика требуется полное понимание природы задачи, только тогда байесовский подход используется на полную мощность. Он позволяет учесть не только то, что «говорят нам данные», но и то, что «говорит нам здравый смысл». В докладе пойдет речь о том, зачем и когда все это нужно и как проводить и интерпретировать такой анализ в питоне.

«'Кис-кис, вдыхай меня через кес' или о чем говорят любители рэпа: Python для тематического моделирования комментариев ВКонтакте»
Дмитрий Сергеев, Aalto University / DataGym

Мы покажем, как собрать 10 миллионов комментариев, использую API ВКонтакте и YouTube, посмотрим, о чем говорят пользователи, слушающие разные жанры музыки, и дадим ответы на такие важные вопросы как:

Может ли тематическое моделирование помочь с кластеризацией жанров?
Есть ли что-то общее у слушателей шансона и джаза?
Как измерить близость Киркорова к Антохе МС?

Следите и подписывайтесь на события сообщества PyData.Moscow

Сбор участников и регистрация: 11:00. Начало докладов: 12:00.
Адрес: Ленинградский проспект, 39, стр. 79.

В форме регистрации укажите, на какую секцию вы планируете пойти: Python- или PyData-трек. Регистрация на один трек, не запрещает посещать другой.

Автор: s_egorov

Источник

Информация

Комментарии

Рекомендуем

PyDaCon meetup в Mail.ru Group: 22 июня

Keynote: «Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda»
Петр Ермаков, Senior Data Scientist в Lamoda и Data Coach в DataGym

Python-трек:
«SQL-боттлнеки: поиск и устранение узких мест при масштабировании»
Михаил Новиков, ведущий разработчик, Fasttrack (fstrk.io)

«Сравнение технологий aiopg & asyncpg»
Алексей Фирсов, ведущий разработчик aio-libs/aiopg

PyData Moscow meetup трек:
«Оформление пайплайна в NLP проекте»
Виталий Радченко, Data Scientist, YouScan

«Стекаем и Блендим. Разбор популярных библиотек Python»
Дмитрий Буслов

PyMC3 — Bayesian Statistical Modelling in Python, Максим Кочуров, PyMC Dev / Samsung AI / Skoltech

«'Кис-кис, вдыхай меня через кес' или о чем говорят любители рэпа: Python для тематического моделирования комментариев ВКонтакте»
Дмитрий Сергеев, Aalto University / DataGym

Информация

Комментарии

Рекомендуем

PyDaCon meetup в Mail.ru Group: 22 июня

Keynote: «Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda» Петр Ермаков, Senior Data Scientist в Lamoda и Data Coach в DataGym

Python-трек: «SQL-боттлнеки: поиск и устранение узких мест при масштабировании» Михаил Новиков, ведущий разработчик, Fasttrack (fstrk.io)

«Сравнение технологий aiopg & asyncpg» Алексей Фирсов, ведущий разработчик aio-libs/aiopg

PyData Moscow meetup трек: «Оформление пайплайна в NLP проекте​» Виталий Радченко, Data Scientist, YouScan

«Стекаем и Блендим. Разбор популярных библиотек Python» Дмитрий Буслов

PyMC3 — Bayesian Statistical Modelling in Python, Максим Кочуров, PyMC Dev / Samsung AI / Skoltech

«'Кис-кис, вдыхай меня через кес' или о чем говорят любители рэпа: Python для тематического моделирования комментариев ВКонтакте» Дмитрий Сергеев, Aalto University / DataGym

Keynote: «Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda»
Петр Ермаков, Senior Data Scientist в Lamoda и Data Coach в DataGym

Python-трек:
«SQL-боттлнеки: поиск и устранение узких мест при масштабировании»
Михаил Новиков, ведущий разработчик, Fasttrack (fstrk.io)

«Сравнение технологий aiopg & asyncpg»
Алексей Фирсов, ведущий разработчик aio-libs/aiopg

PyData Moscow meetup трек:
«Оформление пайплайна в NLP проекте»
Виталий Радченко, Data Scientist, YouScan

«Стекаем и Блендим. Разбор популярных библиотек Python»
Дмитрий Буслов

«'Кис-кис, вдыхай меня через кес' или о чем говорят любители рэпа: Python для тематического моделирования комментариев ВКонтакте»
Дмитрий Сергеев, Aalto University / DataGym