Привет! Меня зовут Савва Степурин, я старший разработчик в группе рекомендательных продуктов в Фантехе Яндекса. Сегодня расскажу вам про то, как мы сделали «Незнакомое» для Моей волны — специальный режим для активного поиска музыкальных открытий.
Рубрика «data science»
Знакомьтесь, «Незнакомое». Как мы сделали новый режим для Моей волны
2024-09-25 в 7:02, admin, рубрики: data science, ml, recsys, машинное обучение, рекомендации, яндексОбнаружение DGA доменов или тестовое задание на позицию intern ML-engineer
2024-09-23 в 15:35, admin, рубрики: data science, machine learning, python3, rag, tf-idf, информационная безопасность, стажировка, тестовое заданиеВ этой статье мы рассмотрим простую задачу, которая используется одной компанией в качестве тестового задания для стажеров на позицию ML-engineer. Она включает обнаружение DGA-доменов — задача, решаемая с помощью базовых инструментов машинного обучения. Мы покажем, как с ней справиться, применяя самые простые методы. Знание сложных алгоритмов важно, но куда важнее — понимать базовые концепции и уметь применять их на практике, чтобы успешно демонстрировать свои навыки.
А-Б тестирование: множественная проверка гипотез
2024-09-11 в 9:52, admin, рубрики: data science, анализ данных, аналитика, проверка гипотез, статистикаСегодня обсудим, как проверять много гипотез в одном эксперименте. Разберёмся, почему растут вероятности ошибок. Познакомимся с метриками множественного тестирования и поправками, которые позволяют их контролировать. Узнаем, как оценить необходимый размер групп и повысить чувствительность.
Меня зовут Коля, я работаю аналитиком данных в X5 Tech. Мы с Сашей продолжаем писать серию статей по А/Б тестированию. Предыдущие статьи можно найти в описании профиля.
Много гипотез
Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 5: Поведенческое интервью + Бонусы
2024-09-09 в 11:59, admin, рубрики: data science, АБ-тесты, математика, поведенческое интервью, подготовка к собеседованию, собеседование в IT, собеседование вопросы, советы новичкам, статистикаПривет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor). Мы строим скоринговые (credit scoring), лидогенерационные (lead generation) и антифрод (anti-fraud) модели на телеком данных, а также делаем гео-аналитику (geo-analytics).
В предыдущей статье я поделился материалами для подготовки к дизайну систем машинного обучения.
Давайте вспомним из каких секций состоит процесс собеседований на позицию Data Scientist:
Как делать бизнес в Open Source
2024-09-04 в 8:57, admin, рубрики: data science, Evidently AI, kaggle, open source, гиперпараметры, интервью, композиции моделей, машинное обучение, технологический стекЭмели Драль — кофаундер и технический директор Evidently AI. У её open source библиотеки для оценки, тестирования и мониторинга качества данных и моделей машинного обучения уже более 22 миллионов скачиваний.
26 сентября Эмели выступит на AI Conf 2024 с докладом «Читать полностью »
You Only Look Once… But it Sees Everything! Обзор YOLO детекторов. Часть 1
2024-08-15 в 12:22, admin, рубрики: bounding box, computer vision, data science, detection, yolo, you only look once, детекцияВступление
На практике пробуем KAN – принципиально новую архитектуру нейросетей
2024-05-03 в 15:14, admin, рубрики: data science, ml, нейронные сети, нейросеть, ПерцептронНа днях ученые из MIT показали альтернативу многослойному перцептрону (MLP). MLP с самого момента изобретения глубокого обучения лежит в основе всех нейросетей, какими мы их знаем сегодня. На его идее в том числе построены большие языковые модели и системы компьютерного зрения.
Однако теперь все может измениться. В KAN (Kolmogorov-Arnold Networks) исследователи реализовали перемещение функций активации с нейронов на ребра нейросети, и такой подход показал блестящие результаты.
Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python
2024-03-08 в 19:01, admin, рубрики: affinity propagation, data science, dbscan, k-means, python, агломеративная кластеризация, алгоритмы машинного обучения, глубокое обучение, кластеризация, машинное обучениеКак я случайно сэкономил компании полмиллиона долларов
2024-01-04 в 11:00, admin, рубрики: data science, зарубежный опыт, мойофис, оптимизация расходов, перевод, экономияРазработчик под ником Ludic*, автор технического блога Ludicity, сэкономил своей компании полмиллиона долларов за пять минут. Это больше, чем он заработал для работодателей за всю его карьеру, поскольку сфера деятельности, о которой далее пойдёт речь, — обман. Он всего лишь нажал на пять кнопок.