- PVSM.RU - https://www.pvsm.ru -
Как мы уже неоднократно сообщали ранее, в этом году компания JUG.ru Group решила заглянуть в будущее и разобраться, какая необходимость двум серым ящикам взаимодействовать друг с другом впустить в наш мир дозу сакральных знаний по Big Data и машинному обучению — мы сделали конференцию SmartData 2017 [1], которая пройдёт в Питере 21 октября.
Зачем мы собираем конференцию по Big Data и машинному обучению? Потому что не можем не собрать. И чтобы обратить в наше братство как можно большее количество разработчиков, мы традиционно открываем бесплатную онлайн-трансляцию из первого зала конференции.
Итак, бесплатная онлайн-трансляция из главного зала SmartData 2017 начнётся 21 октября 2017 года в 9:30 утра по московскому времени. Только вы, мы и будущее. В этот раз трансляция будет доступна в 2k — доставайте ваши 4k мониторы!
Ссылка на онлайн-трансляцию первого трека конференции SmartData 2017 и краткое описание докладов — под катом.
В первом треке конференции, проходящем в главном зале, [3] выступают:
В перерывах между докладами, когда спикеры и участники на площадке удаляются в зазеркалье дискуссионных зон, зрителям онлайн-трансляции мы показываем репортажи о внесессионных событиях конференции и берём увлекательные интервью у докладчиков и интересных гостей. Если по ходу интервью у вас возникает собственный вопрос — пишите его в Telegram-чат конференции [4]. Вот как это выглядело на JPoint:
9:30 — 10:30 // Открытие, интервью с командой JUG.ru Group, вступительные слова от организаторов и партнеров конференции.
10:30-11:20 Виталий Худобахшов — Имя — это фича [5]
Как бы странно это ни казалось образованному человеку, вероятность быть одинокой/одиноким «зависит» от имени. Мы поговорим про любовь и отношения, а точнее, что именно могут рассказать об этом данные социальной сети. Это примерно всё равно, что сказать: «Вероятность быть сбитым машиной, если тебя зовут Серёжа, выше, чем если бы тебя звали Костя!» Звучит довольно дико, не правда ли? Ну, как минимум, ненаучно. Таким образом, мы поговорим о самых неожиданных и контринтуитивных наблюдениях, которые можно сделать с помощью анализа данных в социальных сетях. Конечно, мы не обойдём вниманием вопросы статистической значимости таких наблюдений, влияния ботов и ложных корреляций.
В настоящее время рекомендательные системы активно применяются как в сфере развлечений (YouTube, Netflix), так и в сфере интернет-маркетинга (Amazon, Aliexpress). В связи с этим, в докладе будут рассмотрены практические аспекты применения глубинного обучения, коллаборативной и контентной фильтрации и фильтрации по времени как подходов в рекомендательных системах. Дополнительно будет рассмотрено построение гибридных рекомендательных систем и модификации подходов для онлайн-обучения на Spark.
Свёрточные нейронные сети давно стали основным классом моделей для обработки изображений. В докладе мы обсудим, как сети, распознающие отдельные объекты, превращаются в сети, выделяющие объекты среди массы других. Мы поговорим и о знаменитом YoLo, и о single-shot detectors, и о линии моделей от R-CNN до совсем недавно появившейся Mask R-CNN.
Машинное обучение — это весело, но чтобы оно работало в промышленности, нужно делать много всего скучного. В данном докладе мы рассмотрим все технологии, алгоритмы и методы, необходимые для того, чтобы ваше машинное обучение сияло, как бриллиант в золотой оправе.
В качестве примера мы рассмотрим одну сложную задачу — персонализацию новостной ленты. Не вдаваясь в детали машинного обучения, мы поговорим о сборе данных (пакетном и в режиме реального времени), ETL, а также об обработке, необходимой для получения модели.
Но просто получить модель недостаточно, поэтому мы также поговорим о том, как получить основанные на модели прогнозы в сложной высоконагруженной распределённой среде и как их использовать для принятия решений.
В данном докладе мы поговорим о технологиях обработки и хранения данных экосистемы Hadoop, а также о многом другом. Этот доклад будет полезен тем, кто занимается машинным обучением не только для развлечения, но и для профита.
Каждый день пользователи совершают миллионы действий в Интернете. Проекту FACETz DMP необходимо структурировать эти данные и проводить сегментацию для выявления предпочтений пользователей. Расскажем, как мы, используя Kafka и HBase:
• сегментируем 600 миллионов пользователей после перехода с MapReduce на Realtime и как мы это сделали;
• обрабатываем 5 миллиардов событий каждый сутки;
• храним статистику по количеству уникальных пользователей в сегменте при потоковой обработке;
• отслеживаем влияние изменений параметров сегментации.
Инфраструктура Hadoop – популярное решение для таких задач, как распределённые хранение и обработка данных. Хорошая масштабируемость и развитая экосистема подкупают и обеспечивают Hadoop’у прочное место в инфраструктуре различных информационных систем. Но чем больше ответственности возлагается на этот компонент, тем важнее обеспечивать его отказоустойчивость и высокую доступность. В докладе мы расскажем про обеспечение высокой доступности компонентов Hadoop-кластера. Кроме этого, поговорим:
• о «зоопарке», с которым мы имеем дело;
• о том, зачем обеспечивать высокую доступность: точки отказа системы и последствия отказов;
• о средствах и решениях, существующих для этого;
• о нашем практическом опыте внедрения: подготовка, деплой, проверки.
Доклад будет наиболее полезен тем, кто уже использует Hadoop (для углубления своих знаний). Другой части аудитории доклад будет интересен с точки зрения обзора архитектурных решений, применяемых в этом программном комплексе.
В 2017 году «искусственный интеллект» — это словосочетание, которое слышно из каждого утюга. Есть много примеров применения машинного обучения и искусственных нейронных сетей в бизнесе, но в этом докладе мы поговорим о творческих возможностях ИИ. Расскажем, как мы делали Neurona [12], Нейронную Оборону [13] и Пианолу [14]. Мы обсудим современные задачи в области построения творческого ИИ и поговорим о том, почему это важно и интересно.
Присоединяйтесь!
Автор: osma
Источник [16]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/cgi/266179
Ссылки в тексте:
[1] конференцию SmartData 2017: https://smartdataconf.ru/
[2] Смотреть онлайн-трансляцию: https://www.youtube.com/watch?v=UAQCmtSzE8Q&list=PLeN_80lmoMY33eTHuAjnkUVVS33YzPZy6&index=1
[3] В первом треке конференции, проходящем в главном зале,: https://smartdataconf.ru/#schedule
[4] Telegram-чат конференции: https://t.me/smartdataconf
[5] 10:30-11:20 Виталий Худобахшов — Имя — это фича: https://smartdataconf.ru/2017/spb/talks/5srlizuqtce00kic0mya2o/
[6] 11:40-12:30 Михаил Камалов — Рекомендательные системы: от матричных разложений к глубинному обучению в поточном режиме: https://smartdataconf.ru/2017/spb/talks/ywt5alcng0wow8iw4uaem/
[7] 12:50-13:40 Сергей Николенко — Глубокие свёрточные сети для обнаружения объектов и сегментации изображений: https://smartdataconf.ru/2017/spb/talks/3niwvfzujkukcce0kgqooi/
[8] 14:25-15:15 Дмитрий Бугайченко — От клика к прогнозу и обратно: Data Science-пайплайны в Одноклассниках: https://smartdataconf.ru/2017/spb/talks/2slkmculqmyci8ysgaygsm/
[9] 15:35-16:25 Артем Маринов — Сегментируем 600 миллионов пользователей в режиме реального времени каждый день: https://smartdataconf.ru/2017/spb/talks/1aa3k7twzoukaci8e060ag/
[10] 16:45-17:35 Александр Крашенинников — Hadoop high availability: опыт Badoo: https://smartdataconf.ru/2017/spb/talks/h934vx14buocak6ga6ms2/
[11] 17:50-18:40 Иван Ямщиков — Neurona: зачем мы научили нейросеть писать стихи в стиле Курта Кобейна?: https://smartdataconf.ru/2017/spb/talks/1pgqaarotaqgokakgay2cm/
[12] как мы делали Neurona: https://www.youtube.com/watch?v=c759T8zOe5A
[13] Нейронную Оборону: https://music.yandex.ru/artist/4445922
[14] Пианолу: https://www.youtube.com/watch?v=5bfI3bhiRa4
[15] YouTube-канал конференции: https://www.youtube.com/channel/UCfCOJWNC_ipu34-LVvPUeCg
[16] Источник: https://habrahabr.ru/post/340402/
Нажмите здесь для печати.