Рубрика «data science» - 5

Вебинары трека Наука о данных Летней цифровой школы Сбера

2025-08-09 в 5:56, admin, рубрики: AI, artificial intelligence, data analysis, data science, глубокое обучение, ИИ, искусственный интеллект, нейронные сети, нейросети

Вебинары трека Наука о данных Летней цифровой школы Сбера

Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.

Сегодня узнаем, что такое проблема подглядывания и почему она появляется. Реализуем аналог метода Покока и критерий Вальда для последовательного тестирования. Посмотрим, можно ли одновременно подглядывать и контролировать вероятности ошибок при том же размере групп. Обсудим границы применимости последовательного тестирования.

Меня зовут Коля, я работаю аналитиком данных в X5 Tech. Мы с Сашей продолжаем писать серию статей по А/Б тестированию. Предыдущие статьи можно найти в описании профиля.

Проблема подглядывания

Читать полностью »

Мета-анализ Хабра 2024: так ли всё плохо?

2025-06-28 в 3:31, admin, рубрики: C#, data science, аналитика, хабр

Люди с самых древних времён интересовались тремя главными вопросами мироздания: почему горит огонь, какой формы земля и мёртв ли Хабр. На последний я постараюсь ответить. И если коротко - я понятия не имею. Быстрый сбор статистики и интерпретация результатов растянулась в несколько раз, ведь чем дальше тем становится всё больше и больше вопросов. А искать ответы - вообще и близко не моё любимое занятие, поэтому все данные будут опубликованы для открытого доступа и возможно кто-то сможет уменьшить количество этих чертовски важных вопросов.

Подготовка

Читать полностью »

Автоматизация сбора и анализа вакансий с сайта Хэдхантер

2025-06-23 в 10:15, admin, рубрики: api, data science, headhunter, matplotlib, pandas, python

Читать полностью »

Фундаментальные вопросы по ML-DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

2025-06-15 в 2:10, admin, рубрики: data science, machine learning, ml-интервью, naive bayes, python, scikit-learn, SVM, Алгоритмы, линейная регрессия, регуляризация

У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение.

Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты!

Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом.

Будет здорово получить ваши задачи и в следующих выпусках разобрать!

Читать полностью »

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

2025-05-24 в 21:25, admin, рубрики: data science, datafeeling, duolingo, machinelearning, RDS, Recovering Difference Softmax

Привет, чемпионы! Алгоритм Recovering Difference Softmax (RDS) – это не просто очередной метод машинного обучения Читать полностью »

Теневая сторона AutoML: когда no-code инструменты вредят больше, чем помогают

2025-05-21 в 14:44, admin, рубрики: data science, mlops, Автоматизация ML, Версионирование данных, машинное обучение

Абстракция — не новинка в мире разработки, но в машинном обучении абстракция без контроля превращает автоматизацию в архитектурный риск.

AutoML для многих организаций стал входной точкой в машинное обучение. Он обещает именно то, что хотят услышать команды, находящиеся под давлением: вы приносите данные, а мы займёмся моделированием. Не нужно управлять пайплайнами, настраивать гиперпараметры или изучать scikit‑learn и TensorFlow — просто кликай, перетаскивай и развёртывай.

На первых порах — сплошной восторг.

Читать полностью »

Мое худшее собеседование в Data Science

2025-05-17 в 13:46, admin, рубрики: data science, машинное обучение, собеседование, собеседование в IT, собеседование вопросы, собеседование на работу, собеседования

Дело было в начале третьего курса учёбы в МФТИ, во времена COVID. Более полугода я активно изучал ML: прошёл несколько курсов, выучил теорию, за месяц прошёл парочку собеседований — в Ozon, Сбер и Яндекс. Там всё было более чем цивильно: очень приятные интервьюеры, простые, добрые люди. Во время собеседований помогали, подсказывали молодому, зелёному ботеру. Остались исключительно приятные воспоминания.

И вот в телеграм-канале с вакансиями я увидел злополучный пост про стажировку в МТС. Тогда я ещё не подозревал, что даже в таких крупных компаниях на собеседованиях может происходить настоящий трешачок.

Читать полностью »

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу

2025-05-08 в 8:48, admin, рубрики: data science, datafeeling, duolingo, machinelearning

Привет, чемпионы! Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. С 2023 года и особенно в 2025-м они вкатились в тему искусственного интеллекта (ИИ) и машинного обучения (ML) по полной. Всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию заданий — теперь почти полностью берёт на себя ИИ. Вот как это работает и почему это круто.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «data science» - 5

Вебинары трека Наука о данных Летней цифровой школы Сбера

Вебинары трека Наука о данных Летней цифровой школы Сбера

1) Process Mining

AutismSmartDetector: Система для определения черт аутистического спектра

Проблема подглядывания и последовательное А-Б тестирование

Проблема подглядывания

Мета-анализ Хабра 2024: так ли всё плохо?

Подготовка

Автоматизация сбора и анализа вакансий с сайта Хэдхантер

Фундаментальные вопросы по ML-DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

Теневая сторона AutoML: когда no-code инструменты вредят больше, чем помогают

Мое худшее собеседование в Data Science

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу