Рубрика «data science» - 29

Как мы сократили время на разработку скоринговых моделей в пять раз, переключившись на Python

2018-08-24 в 8:40, admin, рубрики: Credit Scoring, data mining, data science, machine learning, python, Алгоритмы, банкинг, Блог компании ID Finance, машинное обучение, регрессия

Сейчас все очень много говорят про искусственный интеллект и его применение во всех сферах работы компании. Однако есть некоторые области, где еще с давних времён главенствует один вид модели, так называемый «белый ящик» — логистическая регрессия. Одна из таких областей – банковский кредитный скоринг.
Читать полностью »

Moscow Data Science Major: анонс и регистрация

2018-08-23 в 6:48, admin, рубрики: big data, computer vision, data science, deep learning, machine learning, mail.ru group, Moscow Data Science, ods, Алгоритмы, Блог компании Mail.Ru Group, искусственный интеллект, машинное обучение

Moscow Data Science Major: анонс и регистрация - 1

1 сентября Mail.Ru Group и сообщество Open Data Science проведут крупнейший митап Moscow Data Science Major. Событие состоит из пяти тематических блоков докладов, одной ML-тренировки и целого зала для нетворкинга и знакомств.

Знакомьтесь с программой и регистрируйтесь! Вход на событие бесплатный, по одобренной регистрации.
Читать полностью »

Открытый вебинар «Наивный байесовский классификатор»

2018-08-20 в 15:10, admin, рубрики: big data, data mining, data science, Байес, Блог компании Отус, классификация, машинное обучение

Всем привет!

В рамках нашего курса Data Scientist мы провели открытый урок на тему «Наивный баейсовский классификатор». Занятие вёл преподаватель курса Максим Кретов — ведущий исследователь в лаборатории нейронных сетей и глубокого обучения (МФТИ). Предлагаем ознакомиться с видео и кратким изложением.

Заранее спасибо.

Читать полностью »

Ищем докладчиков на Moscow Data Science Major

2018-08-08 в 10:48, admin, рубрики: big data, data mining, data science, mail.ru group, meetup, Блог компании Mail.Ru Group, машинное обучение

1 сентября Mail.Ru Group и сообщество Open Data Science проведут крупнейший митап Moscow Data Science.

Откроем новый учебный и рабочий год целым днём секций и нетворкинга!
Читать полностью »

Почему вам стоит улучшить тренировочные данные, и как это сделать

2018-08-02 в 14:04, admin, рубрики: big data, data science, Блог компании Отус, классификаторы, машинное обучение, Программирование

Всем привет!

А у нас тут запускается, можно сказать, почти новый курс — Data Scientist. Почему почти? Просто вырос он из курса по BigData, но теперь с куда большим упором в работу с данными, обучением, сети и вот это всё. Новые преподаватели, немного (примерно процентов двадцать) новой программы курсы и доработанной старой, ну и как всегда — статьи, которые нам показались интересными в рамках курса и открытые уроки по этим же темам.

Поехали!

Почему вам стоит улучшить тренировочные данные, и как это сделать - 1 Читать полностью »

Массовый стекинг моделей ML в production: реально или нет?

2018-07-26 в 11:30, admin, рубрики: als, data science, feature, feature selection, ml, production, stacking, Алгоритмы, Блог компании HeadHunter, логистическая регрессия, машинное обучение, нейросети, поисковые технологии, признаки, продакшн, стекинг, факторизационные машины

Довольно часто нас спрашивают, почему мы не устраиваем соревнований дата-сайентистов. Дело в том, что по опыту мы знаем: решения в них совсем не применимы к prod. Да и нанимать тех, кто окажется на ведущих местах, не всегда имеет смысл.

Массовый стекинг моделей ML в production: реально или нет? - 1

Такие соревнования часто выигрывают с помощью так называемого китайского стекинга, когда комбинаторным способом берут все возможные алгоритмы и значения гиперпараметров, и полученные модели в несколько уровней используют сигнал друг от друга. Обычные спутники этих решений — сложность, нестабильность, трудность при отладке и поддержке, очень большая ресурсоёмкость при обучении и прогнозировании, необходимость внимательного надзора человека в каждом цикле повторного обучения моделей. Смысл делать это есть только на соревнованиях — ради десятитысячных в локальных метриках и позиций в турнирной таблице.

Читать полностью »

Личный опыт: Data Engineering на Upwork

2018-07-20 в 22:33, admin, рубрики: big data, data engineering, data science, Upwork, карьера, Карьера в IT-индустрии, машинное обучение, фриланс

Я много лет работал Data Engineer'ом и Data Scientist'ом, решал сложные бизнес-кейсы, строил большие системы, выводил это все в продакшен. В начале 2017го я бросил ~~пить, курить и~~ работать в офисе и ушел фрилансить, экспериментировать с альтернативными формами занятости. Довольно много времени я провел на Upwork. Судя по многочисленным комментариям, уважаемая аудитория не до конца представляет себе, что это такое. Вещаю.

Upwork это крупнейшая в мире биржа фриланса. Дата сатанисты и дата инженеры мало кому в этом мире нужны (по сравнению с переводчиками, веб-мастерами и переписывателями текстов), так что задач для нас относительно мало, так что они тяготеют к крупнейшей бирже в мире. Других фриланс-бирж с постоянным потоком задач для дата саентистов в мире нет — ни Guru, ни Toptal, ни отечественный fl.ru спросом похвастаться не могут. Что важно — для специалистов более массовых специальностей опыт фриланса может сильно отличаться.Читать полностью »

Зов Даты, или Как прошел второй хакатон Почты Mail.Ru

2018-07-19 в 13:17, admin, рубрики: data mining, data science, Блог компании Mail.Ru Group, почта mail.ru, хакатон, Хакатоны

14-15 июля Почта Mail.Ru провела свой второй хакатон SmartMail Hack 2: Call of Data. Участникам нужно было разработать новое, интересное и полезное решение для представления данных из Почты. И по горячим следам спешим рассказать о победивших на хакатоне проектах.

Зов Даты, или Как прошел второй хакатон Почты Mail.Ru - 1
Читать полностью »

4 года Data Science в Schibsted Media Group

2018-07-18 в 8:28, admin, рубрики: big data, data mining, data science, data scientist, okr, аналитика, карьера, машинное обучение, менеджер продуктов, причинно-следственные связи, причинность, прогнозирование, сложность, управление данными, управление командой, управление персоналом, Управление продуктом

Секретные материалы

В 2014-м году я присоединился к небольшой команде в Schibsted Media Group в качестве 6-го специалиста по Data Science в этой компании. С тех пор я поработал над многими начинаниями в области Data Science в организации, в которой теперь таких уже 40 с лишним человек. В этом посте я расскажу о некоторых вещах, о которых узнал за последние четыре года, сперва как специалист, а затем как менеджер Data Science.

Этот пост следует примеру Robert Chang и его отличной статьи «Doing Data Science in Twitter», которую я нашел очень ценной, когда впервые прочитал ее в 2015-м году. Цель моего собственного вклада ― поведать настолько же полезные мысли специалистам и менеджерам Data Science по всему миру.

Я поделил пост на две части:

Часть I: Data Science в реальной жизни
Часть II: Управление командой Data Science

Читать полностью »

День открытых дверей в Нетологии, тема Data Science

2018-07-16 в 15:22, admin, рубрики: data science, Блог компании Нетология, воркшоп, день открытых дверей, Карьера в IT-индустрии, нетология

Хабровчане, привет! На связи главред блога Нетологии. 18 июля у нас пройдет день открытых дверей курса Data Science. Мероприятие офлайновое, но будет трансляция для всех желающих.

Программа:

19:00 — О курсе Data Scientist: программа, эксперты, форматы обучения и дипломный проект / продюсер курса Настя Дорожкина, Нетология.
19:25 — Обработка данных на Python с использованием pandas: разбор кейсов и построение простой модели / преподаватель курса Константин Башевой, Яндекс.Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «data science» - 29

Как мы сократили время на разработку скоринговых моделей в пять раз, переключившись на Python

Moscow Data Science Major: анонс и регистрация

Открытый вебинар «Наивный байесовский классификатор»

Ищем докладчиков на Moscow Data Science Major

Почему вам стоит улучшить тренировочные данные, и как это сделать

Массовый стекинг моделей ML в production: реально или нет?

Личный опыт: Data Engineering на Upwork

Зов Даты, или Как прошел второй хакатон Почты Mail.Ru

4 года Data Science в Schibsted Media Group

День открытых дверей в Нетологии, тема Data Science