Рубрика «ml» - 18

Нейронки пошли не туда - 1

Долго пытался сформулировать, почему мне нравится Claude и Gemini и умение рассуждать ChatGPT.

И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.

Интуиция не врёт.
(Юдковский перевернулся в гробу)

Читать полностью »

Представьте недалёкое будущее. ИИ везде и во всём помогает человеку. Коллеги разговаривают в офисе перед обедом. Автоматическая кухня на основе их предпочтений, интенсивности тренировок, особенностей повседневной жизни и эмоционального состояния готовит им подходящий набор блюд. Виртуальные помощники отбирают и сообщают только нужные и полезные новости, а рабочие консультанты суммаризируют данные по проектам и выстраивают прогноз занятости и нагрузок. Коллеги ведут неспешный small talk, чтобы отвлечься от рабочего процесса.

Читать полностью »

Всем привет! Недавно я закончил один из этапов собственного проекта, в котором я провел сравнительный анализ 3 одних из самых известных нейросетей для семантической сегментации: U-Net, LinkNet, PSPNet. Теперь я хочу поделиться со всеми, чтобы в случае, если кто-то захочет сделать что-то подобное или ему просто понадобится, то он не искал весь интернет, как я, а легко и просто все нашел. В конце главы каждый нейросети я оставил ссылки на оригинальные статьи для желающих самостоятельно все изучить (на английском). Ссылка на мой GitHub с полноценной версией всех нейросетей и main файла в конце статьи.

Читать полностью »

В последние годы стало очевидно, что классические центральные процессоры (CPU) и видеокарты (GPU) уже не всегда поспевают за непрерывным ростом и усложнением нейронных сетей. Вместо бесконечного наращивания «универсального» железа, компании начали разрабатывать и внедрять в своих дата-центрах Domain-Specific Architecture (DSA) — аппаратные ускорители, заточенные под конкретные задачи.

Google TPU (Tensor Processing Unit) — одно из первых крупных решений такого рода. Начиная с 2015 года (поколение TPUv1), Google успела вывести на рынок несколько поколений TPU для внутренних нужд: TPUv1 и TPUv2/v3, а в 2020 году — новое решение TPUv4iЧитать полностью »

Суть моего труда заключается в том, чтобы определить функцию для нахождения n-ого числа Фибоначчи с линейной сложностью поиска. Вот какие методы я попробовал:

Возможно получится по простым данным постоить полином большой степени, используя метод неопределённых коэффициентов и использовать его для подсчёта последующих значений последовательности.

Читать полностью »

Распознавание жестов — это технология, которая позволяет людям взаимодействовать с устройствами без физического нажатия кнопок или сенсорных экранов. Интерпретируя жесты человека, эта технология нашла свое применение в различных потребительских устройствах, включая смартфоны и игровые консоли. В основе распознавания жестов лежат два ключевых компонента: сенсор и программный алгоритм.

Читать полностью »

Автор статьи: Сергей Артамонов - DS Wildberries, Research Engineer Skoltech, аспирант мехмата МГУ, преподаватель Школы Высшей Математики

Читать полностью »

В эпоху, когда ИИ проникает в каждый сектор, понимание различий между AI Engineering и ML Engineering становится ключевым для выбора стратегии разработки. Книга AI Engineering: Building Applications with Foundation Models ярко иллюстрирует, как фундаментальные модели (foundation models) переворачивают традиционные подходы. Вот что важно знать.

Почему сегодня AI Engineering вытесняет ML Engineering?

  1. Демократизация доступа к ИИ

    Раньше: Создание ML‑моделей требовало месяцев работы с raw data, обучения архитектур и настройки гиперпараметров. Например, обучение GPT-3 потребовало 3,5 тыс. GPU‑лет.

    СейчасЧитать полностью »

Привет! Сегодня поговорим про такого зверя, как positional bias. Если вы работаете с поисковыми системами или рекомендательными сервисами, то наверняка сталкивались с этой проблемой. Разберёмся на примере задачи по ml system design — предсказание вероятности клика по товару (известной как CTR — Click-Through Rate) в поисковой выдаче.

Описание задачи.
Вы владелец товарной платформы. На платформе продавцы могут продвигать товары за фиксированную ставку. Ставка взимается только в том случае, если был совершен клик по товару. У вас есть определенное количество свободных слотов для продвижения товаров. Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js