Рубрика «deep learning»

RuGPT3. Исследование вариантов циклическим перебором

2023-07-02 в 5:32, admin, рубрики: deep learning, gpt, machine learning, natural language processing, nlp, rugpt3, генеративные модели, искусственные нейронные сети, искусственный интеллект, машинное обучение, обработка естественного языка, языковые модели

RuGPT3 - коллекция генеративных моделей от Сбер
Проводим автоматическое тестирование циклическим перебором вариантов

RuGPT3. Исследование вариантов циклическим перебором - 1

Работаем в Colab, тестируем Small, Mediub, Large.
Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.
Читать полностью »

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

2023-03-12 в 11:05, admin, рубрики: deep learning, natural language processing, python, английский язык, бинарная классификация, датасеты по английскому языку, изучение языков, искусственный интеллект, машинное обучение, нейросеть, носители языка

Владение английским языком принято оценивать по системе CERF (Common European Reference Framework), состоящей из шести уровней, где уровень A1 – начинающие, а уровень С2 – профессионально владеющие иностранным языком. Международный уровень С2 часто позиционируется как “уровень образованного носителя”, и получение соответствующего сертификата зачастую является либо заветной мечтой, либо предметом гордости преподавателя-лингвиста.

Читать полностью »

Перцептрон на numpy

2023-01-21 в 19:07, admin, рубрики: deep learning, from scratch, numpy, perceptron, python, машинное обучение, нейросеть, обучение, персептрон

Я придерживаюсь мнения, что если хочешь в чем-то разобраться, то реализуй этой сам. Когда я только начинал заниматься датасаенсом, я разобрался, как считать градиенты на бумажке, перескочил этап реализации сеток на numpy и сразу стал их обучать. Однако, когда спустя долгое я всё-таки решил это сделать, то столкнулся с тем, что не могу это сделать, потому что у меня не сходятся размерности.

Перебрав множество материалов, я остановился на книге Deep Learning from Scratch. Теперь я разобрался, и хочу сделать свой туториал.

Читать полностью »

Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov

2022-12-03 в 19:53, admin, рубрики: AI, BERT, deep learning, deeppavlov, natural language processing, nlp (natural language processing), open source, python, pytorch, transfer learning, искусственный интеллект, машинное обучение, нейронные сети, обработка текстов

Соревнования GLUE и SuperGLUE

В последние годы соревнования GLUE и SuperGLUE Читать полностью »

Как лучше обучать RNN для прогнозирования временных рядов?

2022-11-26 в 19:27, admin, рубрики: deep learning, gru, LSTM, python, RNN, искусственный интеллект, машинное обучение, финансы в IT

Привет!

Два последних года я в рамках магистерской диссертации разбирался с тем, как лучше использовать рекуррентные нейронные сети для прогнозирования временных рядов, и теперь хочу поделиться моим опытом с сообществом.

Я разделил свой рассказ на несколько блоков:

Что такое RNN
Рекуррентные нейроны
Методы обработки временных рядов
Стратегии прогнозирования
Добавление факторов в RNN
Глобальные модели RNN

Читать полностью »

Хакинг метрик качества видео или как с приходом ИИ все становится намного сложнее

2022-11-22 в 8:02, admin, рубрики: computer science, data science, deep learning, JPEG AI, PSNR, SSIM, Super Resolution, VMAF, искусственный интеллект, машинное обучение, метрики качества видео, Научно-популярное, Программирование, сжатие видео, сжатие данных

Читать полностью »

Разбираемся с устройством свёрток на примере объединения двух свёрток в одну в pytorch

2022-06-12 в 15:09, admin, рубрики: computer vision, convolution, deep learning, python, pytorch, математика, машинное обучение

Неинтересная цель этой статьи — показать, как можно смержить две свертки пайторча в одну. Если интересна лишь реализация — прошу в конец статьи.

А интересная цель — потыкать непосредственно в веса моделей на примере объединения свёрток. Узнать, как они хранятся и используются конкретно в pytorch, не вдаваясь в хардкорные интересности по типу im2col.
Но перед тем, как показывать реализацию, давайте немного вспомним, с чем работаем.

Читать полностью »

Как мы не смогли создать медицинского чат-бота. История проекта, который так и не увидел свет

2022-06-07 в 14:49, admin, рубрики: chatbots, classification, data processing, data science, deep learning, machine learning, named entity recognition, natural language processing, python, telemedicine, Блог компании MTS AI, искусственный интеллект, машинное обучение

Привет,

Читать полностью »

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

2022-01-28 в 7:59, admin, рубрики: computer vision, data mining, deep learning, machine learning, natural language processing, nlp (natural language processing), ozon tech, Блог компании Ozon Tech, машинное обучение, обработка изображений

Привет! Меня зовут Александр, я работаю в команде матчинга Ozon. Ежедневно мы имеем дело с десятками миллионов товаров, и наша задача — поиск и сопоставление одинаковых предложений (нахождение матчей) на нашей площадке, чтобы вы не видели бесконечную ленту одинаковых товаров.
На странице любого товара на Ozon есть картинки, заголовок, описание и дополнительные атрибуты. Всю эту информацию мы хотим извлекать и обрабатывать для решения разных задач. И особенно она важна для команды матчинга.
Чтобы извлекать признаки из товара, мы строим его векторные представления (эмбеддинги), используя различные текстовые модели (fastText, трансформеры) для описаний и заголовков и целый набор архитектур свёрточных сетей (ResNet, Effnet, NFNet) — для картинок. Далее эти векторы используются для генерации фичей и товарного сопоставления.
На Ozon ежедневно появляются миллионы обновлений — и считать эмбеддинги для всех моделей становится проблематично. А что, если вместо этого (где каждый вектор описывает отдельную часть товара) мы получим один вектор для всего товара сразу? Звучит неплохо, только как бы это грамотно реализовать…

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов - 1
Читать полностью »

Рождение Albumentations

2021-12-09 в 12:59, admin, рубрики: Albumentations, computer vision, deep learning, open source, python, Алгоритмы, Блог компании Open Data Science, машинное обучение, обработка изображений

В этом посте я расскажу историю появления Open Source библиотеки Albumentations как я ее запомнил. В технические детали углубляться не буду. Основная задача текста - логирование, то есть надо написать историю, которую мне будет интересно прочитать через 20 лет.

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «deep learning»

RuGPT3. Исследование вариантов циклическим перебором

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

Перцептрон на numpy

Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov

Соревнования GLUE и SuperGLUE

Как лучше обучать RNN для прогнозирования временных рядов?

Хакинг метрик качества видео или как с приходом ИИ все становится намного сложнее

Разбираемся с устройством свёрток на примере объединения двух свёрток в одну в pytorch

Как мы не смогли создать медицинского чат-бота. История проекта, который так и не увидел свет

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

Рождение Albumentations

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «deep learning»

Соревнования GLUE и SuperGLUE

Новости

Актуальные темы

Архив