Рубрика «машинное обучение» - 252

Представляем первую статью в серии, задуманной, чтобы помочь быстро разобраться в технологии глубокого обучения; мы будем двигаться от базовых принципов к нетривиальным особенностям с целью получить достойную производительность на двух наборах данных: MNIST (классификация рукописных цифр) и CIFAR-10 (классификация небольших изображений по десяти классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик).

Глубокое обучение для новичков: распознаем рукописные цифры - 1
Читать полностью »

Сегодня мы анонсировали новый поисковый алгоритм «Палех». Он включает в себя все те улучшения, над которыми мы работали последнее время.

Например, поиск теперь впервые использует нейронные сети для того, чтобы находить документы не по словам, которые используются в запросе и в самом документе, а по смыслу запроса и заголовка.

Искусственный интеллект в поиске. Как Яндекс научился применять нейронные сети, чтобы искать по смыслу, а не по словам - 1

Уже много десятилетий исследователи бьются над проблемой семантического поиска, в котором документы ранжируются, исходя из смыслового соответствия запросу. И теперь это становится реальностью.

В этом посте я постараюсь немного рассказать о том, как у нас это получилось и почему это не просто ещё один алгоритм машинного обучения, а важный шаг в будущее.
Читать полностью »

Китайский робот-охранник с электрошокером AnBot заступил в патруль - 1

В Шэньчжэне начал работу первый патрульный робот для работы с гражданским населением, у которого есть вооружение. AnBot похож на своих сородичей как и формой ездящего яйца, так и основной функцией — аудиовизуально искать нарушения и сообщать об этом человеку. У AnBot есть небольшое отличие: он может не просто сообщать об угрозе, но и разгонять толпу электрошокером.

Впервые робота показали в апреле этого года. Разработка Университета национальной обороны Народно-освободительной армии Китая напоминает Далека из «Доктора Кто»: весит 78 килограммов, имеет рост в полтора метра и диаметр в 80 сантиметров. При внешней неповоротливости разработчики обещают максимальную скорость в 18 километров в час — сравнимо со средней скоростью бега. Впрочем, патрульная скорость робота — 1 км/ч, о возможности езды по препятствиям ничего не сообщается. AnBot работает до 8 часов на одном заряде.
Читать полностью »

Статистика для математика - 1

В современных условиях интерес к анализу данных постоянно и интенсивно растет в совершенно различных областях, таких как биология, лингвистика, экономика, и, разумеется, IT. Основу этого анализа составляют статистические методы, и разбираться в них необходимо каждому уважающему себя специалисту в data mining.

К сожалению, действительно хорошая литература, такая что умела бы предоставить одновременно математически строгие доказательства и понятные интуитивные объяснения, встречается не очень часто. И данные лекции, на мой взгляд, необычайно хороши для математиков, разбирающихся в теории вероятностей именно по этой причине. По ним преподают магистрам в немецком университете имени Кристиана-Альбрехта на программах «Математика» и «Финансовая математика». И для тех, кому интересно, как этот предмет преподается за рубежом, я эти лекции перевел. На перевод у меня ушло несколько месяцев, я разбавил лекции иллюстрациями, упражнениями и сносками на некоторые теоремы. Замечу, что я не профессиональный переводчик, а просто альтруист и любитель в этой сфере, так что приму любую критику, если она конструктивна.

Вкратце, лекции вот о чем:
Читать полностью »

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 2 - 1

Публикуем вторую часть статьи о типах архитектуры нейронных сетей. Вот первая.

За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.

Читать полностью »

Роботы будущего будут обучаться благодаря любопытству и самостоятельному определению целей - 1

Представьте себе, что друг просит вас помочь прибраться в его комнате, полной разных вещей и мебели. Но представьте также, что помогать вам в этом он не будет, а просто опишет вам, показав фотографии, то, как ему хотелось бы, чтобы его комната выглядела в итоге. Задача может показаться скучной, но любой из нас справится с ней. Будучи детьми, мы открывали новые объекты, научились распознавать их и выработали навыки обращения с ними. Подталкиваемые любопытством, мы постепенно нарабатывали визуальное, внимательное и сенсорно-моторное знание, позволяющее нам, взрослым, обращаться с нашим физическим окружением по нашему выбору.

Сегодняшние роботы не приспособлены для таких задач. Представьте гуманоидного робота, помогающего прибираться в комнате. Допустим, вы показали роботу комнату в нормальном, убранном состоянии, и когда в ней наступил беспорядок, вы приказываете роботу убрать её до первоначального состояния. В таких условиях было бы очень утомительно учить робота тому, куда направлять внимание, и как управляться с каждым из объектов, чтобы положить его в правильной позиции на нужное место, или как выстроить последовательность действий.
Читать полностью »

Разработка интеллектуальных систем распознавания данных становится все более актуальной по мере развития интернета вещей и стремительного увеличения количества информации, которую собирают и которой обмениваются устройства: от камер систем безопасности до спутников, производящих съемку поверхности Земли. Однако анализ этой информации и последующее принятие решений пока остается за человеком: в силу естественных ограничений он не может быстро обрабатывать большие объемы данных и поэтому остается “узким местом” в процессе сбора и управления информацией.

Фонд перспективных исследований: конкурс на лучшую интеллектуальную технологию дешифрирования аэрокосмической информации - 1
Читать полностью »

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1 - 1

За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.
Читать полностью »

В наши дни онлайн-игры весьма популярны, особенно среди молодёжи. Играми занимают свободное время, нередко виртуальными соратниками или врагами становятся члены семей или друзья. Во многих случаях игрокам нужно что-либо покупать для того, чтобы улучшить своего персонажа и получить преимущество перед другими геймерами.

Машинное обучение и Intel Xeon: рекомендательная система для внутриигровых покупок Tencent - 1


— Лошадью ходи, век воли не видать!

Для того, чтобы усовершенствовать способы взаимодействия с пользователями, Tencent внедрила рекомендательную систему. Эта система построена на основе методов машинного обучения и призвана помогать пользователям принимать решения о внутриигровых покупках.
Читать полностью »

Когда речь заходит про машинное обучение, обычно подразумевают большие объемы данных — миллионы или даже миллиарды транзакций, из которых надо сделать сложный вывод о поведении, интересах или текущем cостоянии пользователя, покупателя или какого-нибудь аппарата (робота, автомобиля, дрона или станка).
Однако в жизни обычного аналитика самой обычной компании много данных встречается нечасто. Скорее даже наоборот — у вас будет мало или очень мало данных — буквально десятки или сотни записей. Но анализ все же нужно провести. Причем не какой попало анализ, а качественный и достоверный.

Зачастую ситуация усугубляется еще и тем, что вы без труда можете нагенерить для каждой записи много признаков (чаще всего добавляют полиномы, разницу с предыдущим значением и значением за прошлый год, one-hot-encoding для категориальных признаков и т.п.). Вот только совсем нелегко разобраться, какие из них действительно полезны, а какие только усложняют модель и увеличивают ошибки вашего прозноза.

Для этого вы можете воспользоваться методами байесовой статистики, например, Automatic Relevance Determination. Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js