Рубрика «data science» - 5

Вебинары трека Наука о данных Летней цифровой школы Сбера

Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.

1) Process Mining

Читать полностью »

Сегодня узнаем, что такое проблема подглядывания и почему она появляется. Реализуем аналог метода Покока и критерий Вальда для последовательного тестирования. Посмотрим, можно ли одновременно подглядывать и контролировать вероятности ошибок при том же размере групп. Обсудим границы применимости последовательного тестирования.

Меня зовут Коля, я работаю аналитиком данных в X5 Tech. Мы с Сашей продолжаем писать серию статей по А/Б тестированию. Предыдущие статьи можно найти в описании профиля.

Проблема подглядывания

Читать полностью »

Люди с самых древних времён интересовались тремя главными вопросами мироздания: почему горит огонь, какой формы земля и мёртв ли Хабр. На последний я постараюсь ответить. И если коротко - я понятия не имею. Быстрый сбор статистики и интерпретация результатов растянулась в несколько раз, ведь чем дальше тем становится всё больше и больше вопросов. А искать ответы - вообще и близко не моё любимое занятие, поэтому все данные будут опубликованы для открытого доступа и возможно кто-то сможет уменьшить количество этих чертовски важных вопросов.

Подготовка

Читать полностью »

У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение.

Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты!

Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом.

Будет здорово получить ваши задачи и в следующих выпусках разобрать!

Читать полностью »
Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее - 1

Привет, чемпионы! Алгоритм Recovering Difference Softmax (RDS) – это не просто очередной метод машинного обученияЧитать полностью »

Абстракция — не новинка в мире разработки, но в машинном обучении абстракция без контроля превращает автоматизацию в архитектурный риск.

AutoML для многих организаций стал входной точкой в машинное обучение. Он обещает именно то, что хотят услышать команды, находящиеся под давлением: вы приносите данные, а мы займёмся моделированием. Не нужно управлять пайплайнами, настраивать гиперпараметры или изучать scikit‑learn и TensorFlow — просто кликай, перетаскивай и развёртывай.

На первых порах — сплошной восторг.

Читать полностью »

Дело было в начале третьего курса учёбы в МФТИ, во времена COVID. Более полугода я активно изучал ML: прошёл несколько курсов, выучил теорию, за месяц прошёл парочку собеседований — в Ozon, Сбер и Яндекс. Там всё было более чем цивильно: очень приятные интервьюеры, простые, добрые люди. Во время собеседований помогали, подсказывали молодому, зелёному ботеру. Остались исключительно приятные воспоминания.

И вот в телеграм-канале с вакансиями я увидел злополучный пост про стажировку в МТС. Тогда я ещё не подозревал, что даже в таких крупных компаниях на собеседованиях может происходить настоящий трешачок.

Читать полностью »

Привет, чемпионы! Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. С 2023 года и особенно в 2025-м они вкатились в тему искусственного интеллекта (ИИ) и машинного обучения (ML) по полной. Всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию заданий — теперь почти полностью берёт на себя ИИ. Вот как это работает и почему это круто.

Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js