Рубрика «machine learning» - 19

Гадание на нейросетях: отметился ли в комментариях к посту сам автор

2019-02-26 в 19:23, admin, рубрики: machine learning, python, машинное обучение, нейросети, обработка текста

Гадание на нейросетях: отметился ли в комментариях к посту сам автор - 1

Поделюсь рассказом о небольшом проекте: как найти в комментариях ответы автора, заведомо не зная кто автор поста.

Свой проект я начинал с минимальными знаниями по машинному обучению и думаю для специалистов тут не будет ничего нового. Этот материал в некотором смысле компиляция разных статей, в нем расскажу, как подходил к задаче, в коде можно найти полезные мелочи и приемы с обработкой естественного языка.
Читать полностью »

Как мы решали задачу продолжения плейлистов на RecSys Challenge и заняли 3 место

2019-02-20 в 12:44, admin, рубрики: machine learning, python, recommender systems, Алгоритмы, математика, машинное обучение

В 2018 наша команда традиционно приняла участие в RecSys Challenge. Это ежегодный конкурс по рекомендательным системам, проводимый в рамках конференции RecSys. Он не такой масштабный, как конкурсы на Kaggle, но считается одним из самых престижных соревнований по рекомендательным системам. В этот раз задача была музыкальной — нужно было построить систему автоматического продолжения плейлистов. В этом посте я подробно рассказываю о нашем решении. Приглашаю под кат.

Как мы решали задачу продолжения плейлистов на RecSys Challenge и заняли 3 место - 1

Читать полностью »

Полцарства за ИИ: сколько банки экономят на машинном обучении, нейросетях и чат-ботах

2019-02-19 в 13:40, admin, рубрики: AI, machine learning, Алгоритмы, Блог компании Binary District, искусственный интеллект, машинное обучение

Оценка кредитоспособности по профилю клиента в фейсбуке, роботы для взыскания долгов и финансовых советов инвесторам, борьба с мошенниками и битва с рутиной — искусственный интеллект в банках нужен почти во всех областях. О том, как ИИ помогает Сбербанку, ВТБ, Тинькофф-банку и другим финансовым организациям экономить миллиарды рублей — в обзоре Binary District.

Полцарства за ИИ: сколько банки экономят на машинном обучении, нейросетях и чат-ботах - 1
Читать полностью »

Как научить машину понимать инвойсы и извлекать из них данные

2019-02-19 в 12:44, admin, рубрики: ABBYY, data augmentation, LSTM, machine learning, ner, ocr, Блог компании ABBYY, высокая производительность, документы, извлечение данных, инвойсы, искусственный интеллект, машинное обучение, нейронные сети, технологии

Как научить машину понимать инвойсы и извлекать из них данные - 1 Привет! Меня зовут Станислав Семенов, я работаю над технологиями извлечения данных из документов в R&D ABBYY. В этой статье я расскажу об основных подходах к обработке полуструктурированных документов (инвойсы, кассовые чеки и т.д.), которые мы использовали совсем недавно и которые используем прямо сейчас. А еще мы поговорим о том, насколько для решения этой задачи применимы методы машинного обучения.
Читать полностью »

Rekko Challenge

2019-02-18 в 14:16, admin, рубрики: big data, boosters, competitive programming, data mining, machine learning, movies, Okko, recommender systems, Блог компании Okko, машинное обучение, Спортивное программирование

Rekko challenge

Сегодня мы запускаем Rekko Challenge 2019 — соревнование по машинному обучению от онлайн-кинотеатра Okko.

Мы предлагаем вам построить рекомендательную систему на реальных данных одного из крупнейших российских онлайн-кинотеатров. Уверены, что эта задача будет интересна и новичкам, и опытным специалистам. Мы постарались сохранить максимальный простор для творчества, при этом не перегружая вас гигабайтными датасетами с сотнями предварительно посчитанных признаков.

Подробнее про Okko, задачу, данные, призы и правила — ниже.

Читать полностью »

Видео докладов с FunTech ML-meetup

2019-02-13 в 12:17, admin, рубрики: conundrum, funcorp, FunTechMeetups, machine learning, mail.ru group, meetup, ML-meetup, vk.com, Yandex.Taxi, Блог компании FunCorp, конференции, машинное обучение, Программирование

Видео докладов с FunTech ML-meetup - 1

В прошлую субботу мы провели бэкенд митап по машинному обучению. В программе было 5 докладов от спикеров из ВКонтакте, Yandex.Taxi, Conundrum, FunCorp и Mail.ru Group. Под катом видео выступлений и ссылки на презентации.Читать полностью »

Делаем прототип бота для боев в Clash Royale

2019-02-07 в 12:09, admin, рубрики: AI, artificial intelligence, bot, clash royale, game bots, machine learning, ml, opencv, python, scala, tags are useless, yolo, Блог компании Binary District, Игры и игровые приставки, искусственный интеллект

У вас бывало, что вы залипаете в какую-то простенькую игру, думая, что с ней вполне бы мог справиться искусственный интеллект? У меня бывало, и я решил попробовать создать такого бота-игрока. Тем более, сейчас много инструментов для компьютерного зрения и машинного обучения, которые позволяют строить модели без глубокого понимания подробностей реализации. «Простые смертные» могут сделать прототип, не строя нейронные сети месяцами с нуля.

Делаем прототип бота для боев в Clash Royale - 1

Под катом вы найдете процесс создания proof-of-concept бота для игры Clash Royale, в котором я использовал Scala, Python и CV-библиотеки. Используя компьютерное зрение и машинное обучение я попытался создать бота для игры, который взаимодействует как живой игрок.
Читать полностью »

Делаем нейронную сеть: как не сломать мозг

2019-02-05 в 16:00, admin, рубрики: deep learning, keras, machine learning, neural networks, python, TensorFlow, машинное обучение

Привет!

В этой небольшой заметке расскажу о двух подводных камнях, с которыми как легко столкнуться, так и легко о них разбиться.

Речь пойдет о создании тривиальной нейронной сети на Keras, с помощью которой будем предсказывать среднее арифметическое двух чисел.

Казалось бы, что может быть проще. И действительно, ничего сложного, но есть нюансы.

Кому тема интересна, добро пожаловать под кат, здесь не будет долгих занудных описаний, просто короткий код и комментарии к нему.
Читать полностью »

Много иероглифов – много нейросетей: как построить эффективную систему распознавания для большого числа классов?

2019-02-05 в 11:51, admin, рубрики: ABBYY, cpu, end-to-end, gpu, kmeans, lenet, machine learning, mnist, SqueezeNet, WideResNet, алфавит, Блог компании ABBYY, иероглифы, искусственный интеллект, машинное обучение, нейросети, сверточные нейронные сети

В прошлых статьях уже писали о том, как у нас устроены технологии распознавания текста:

Навигатор по серии постов

Примерно так же до 2018 года было устроено распознавание японских и китайских символов: в первую очередь с использованием растровых и признаковых классификаторов. Но с распознаванием иероглифов есть свои трудности:

1). Огромное количество классов, которое нужно различать.
2). Более сложное устройство символа в целом.

Сказать однозначно, сколько символов насчитывает китайская письменность, так же сложно, как точно посчитать, сколько слов в русском языке. Но наиболее часто в китайской письменности используются ~10 000 символов. Ими мы и ограничили число классов, используемых при распознавании.

Обе описанные выше проблемы также приводят и к тому, что для достижения высокого качества приходится использовать большое количество признаков и сами эти признаки вычисляются на изображениях символов дольше.

Чтобы эти проблемы не приводили к сильнейшим замедлениям во всей системе распознавания, приходилось использовать множество эвристик, в первую очередь направленных на то, чтобы быстро отсечь значительное количество иероглифов, на которые эта картинка точно не похожа. Это всё равно не до конца помогало, а нам хотелось вывести наши технологии на качественно новый уровень.

Мы стали исследовать применимость свёрточных нейронных сетей, чтобы поднять как качество, так и скорость распознавания иероглифов. Хотелось заменить весь блок распознавания отдельного символа для этих языков с помощью нейронных сетей. В этой статье мы расскажем, как нам в итоге это удалось.
Читать полностью »

Открытый курс «Deep Learning на пальцах»

2019-02-05 в 8:05, admin, рубрики: computer vision, deep learning, machine learning, MOOC, nlp, opendatascience, reinforcement learning, Блог компании Open Data Science, машинное обучение, обработка изображений

После 18-го февраля начнется открытый и бесплатный курс "Deep Learning на пальцах".

Курс предназначен для того, чтобы разобраться с современным deep learning с нуля, и не требует знаний ни нейросетей, ни machine learning вообще. Лекции стримами на Youtube, задания на Питоне, обсуждения и помощь в лучших русскоязычных чат-сообществах — ODS.ai и ClosedCircles.

После него вы не станете экспертом, но поймете про что все это, сможете применять DL на практике и будете способны разбираться дальше сами. Ну, в лучшем случае.

Одновременно и в том же объеме курс будет читаться для магистрантов Новосибирского Государственного Университета, а также студентов CS центра Новосибирска.

Выглядеть объяснение на пальцах будет примерно так:

Открытый курс «Deep Learning на пальцах» - 1

Главная ссылка — dlcourse.ai. Подробности ниже.

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «machine learning» - 19

Гадание на нейросетях: отметился ли в комментариях к посту сам автор

Как мы решали задачу продолжения плейлистов на RecSys Challenge и заняли 3 место

Полцарства за ИИ: сколько банки экономят на машинном обучении, нейросетях и чат-ботах

Как научить машину понимать инвойсы и извлекать из них данные

Rekko Challenge

Видео докладов с FunTech ML-meetup

Делаем прототип бота для боев в Clash Royale

Делаем нейронную сеть: как не сломать мозг

Много иероглифов – много нейросетей: как построить эффективную систему распознавания для большого числа классов?

Открытый курс «Deep Learning на пальцах»

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «machine learning» - 19

Новости

Актуальные темы

Архив