Представляем первую статью в серии, задуманной, чтобы помочь быстро разобраться в технологии глубокого обучения; мы будем двигаться от базовых принципов к нетривиальным особенностям с целью получить достойную производительность на двух наборах данных: MNIST (классификация рукописных цифр) и CIFAR-10 (классификация небольших изображений по десяти классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик).
Рубрика «машинное обучение» - 252
Глубокое обучение для новичков: распознаем рукописные цифры
2016-11-07 в 15:47, admin, рубрики: deep learning, machine learning, neural networks, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучениеИскусственный интеллект в поиске. Как Яндекс научился применять нейронные сети, чтобы искать по смыслу, а не по словам
2016-11-02 в 8:01, admin, рубрики: deep learning, Блог компании Яндекс, машинное обучение, нейронные сети, поисковые технологии, СемантикаСегодня мы анонсировали новый поисковый алгоритм «Палех». Он включает в себя все те улучшения, над которыми мы работали последнее время.
Например, поиск теперь впервые использует нейронные сети для того, чтобы находить документы не по словам, которые используются в запросе и в самом документе, а по смыслу запроса и заголовка.
Уже много десятилетий исследователи бьются над проблемой семантического поиска, в котором документы ранжируются, исходя из смыслового соответствия запросу. И теперь это становится реальностью.
В этом посте я постараюсь немного рассказать о том, как у нас это получилось и почему это не просто ещё один алгоритм машинного обучения, а важный шаг в будущее.
Читать полностью »
Китайский робот-охранник с электрошокером AnBot заступил в патруль
2016-11-01 в 10:29, admin, рубрики: AnBot, будущее здесь, искусственный интеллект, китай, Компьютерное зрение, машинное обучение, робототехника, роботы, суперкомпьютеры, Тяньхэ-2В Шэньчжэне начал работу первый патрульный робот для работы с гражданским населением, у которого есть вооружение. AnBot похож на своих сородичей как и формой ездящего яйца, так и основной функцией — аудиовизуально искать нарушения и сообщать об этом человеку. У AnBot есть небольшое отличие: он может не просто сообщать об угрозе, но и разгонять толпу электрошокером.
Впервые робота показали в апреле этого года. Разработка Университета национальной обороны Народно-освободительной армии Китая напоминает Далека из «Доктора Кто»: весит 78 килограммов, имеет рост в полтора метра и диаметр в 80 сантиметров. При внешней неповоротливости разработчики обещают максимальную скорость в 18 километров в час — сравнимо со средней скоростью бега. Впрочем, патрульная скорость робота — 1 км/ч, о возможности езды по препятствиям ничего не сообщается. AnBot работает до 8 часов на одном заряде.
Читать полностью »
Статистика для математика
2016-10-31 в 12:41, admin, рубрики: CAU, data mining, лекции, математика, математическая статистика, машинное обучение, теория вероятностей
В современных условиях интерес к анализу данных постоянно и интенсивно растет в совершенно различных областях, таких как биология, лингвистика, экономика, и, разумеется, IT. Основу этого анализа составляют статистические методы, и разбираться в них необходимо каждому уважающему себя специалисту в data mining.
К сожалению, действительно хорошая литература, такая что умела бы предоставить одновременно математически строгие доказательства и понятные интуитивные объяснения, встречается не очень часто. И данные лекции, на мой взгляд, необычайно хороши для математиков, разбирающихся в теории вероятностей именно по этой причине. По ним преподают магистрам в немецком университете имени Кристиана-Альбрехта на программах «Математика» и «Финансовая математика». И для тех, кому интересно, как этот предмет преподается за рубежом, я эти лекции перевел. На перевод у меня ушло несколько месяцев, я разбавил лекции иллюстрациями, упражнениями и сносками на некоторые теоремы. Замечу, что я не профессиональный переводчик, а просто альтруист и любитель в этой сфере, так что приму любую критику, если она конструктивна.
Вкратце, лекции вот о чем:
Читать полностью »
[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 2
2016-10-31 в 12:40, admin, рубрики: deep learning, machine learning, neural networks, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучение![[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 2 - 1 [ В закладки ] Зоопарк архитектур нейронных сетей. Часть 2 - 1](https://www.pvsm.ru/images/2016/10/31/v-zakladki-zoopark-arhitektur-neironnyh-setei-chast-2.png)
Публикуем вторую часть статьи о типах архитектуры нейронных сетей. Вот первая.
За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.
Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.
Роботы будущего будут обучаться благодаря любопытству и самостоятельному определению целей
2016-10-31 в 7:43, admin, рубрики: будущее здесь, вкалывают роботы, внутренняя мотивация, искусственный интеллект, машинное обучение, робототехника, метки: внутренняя мотивация
Представьте себе, что друг просит вас помочь прибраться в его комнате, полной разных вещей и мебели. Но представьте также, что помогать вам в этом он не будет, а просто опишет вам, показав фотографии, то, как ему хотелось бы, чтобы его комната выглядела в итоге. Задача может показаться скучной, но любой из нас справится с ней. Будучи детьми, мы открывали новые объекты, научились распознавать их и выработали навыки обращения с ними. Подталкиваемые любопытством, мы постепенно нарабатывали визуальное, внимательное и сенсорно-моторное знание, позволяющее нам, взрослым, обращаться с нашим физическим окружением по нашему выбору.
Сегодняшние роботы не приспособлены для таких задач. Представьте гуманоидного робота, помогающего прибираться в комнате. Допустим, вы показали роботу комнату в нормальном, убранном состоянии, и когда в ней наступил беспорядок, вы приказываете роботу убрать её до первоначального состояния. В таких условиях было бы очень утомительно учить робота тому, куда направлять внимание, и как управляться с каждым из объектов, чтобы положить его в правильной позиции на нужное место, или как выстроить последовательность действий.
Читать полностью »
Фонд перспективных исследований: конкурс на лучшую интеллектуальную технологию дешифрирования аэрокосмической информации
2016-10-28 в 10:27, admin, рубрики: Блог компании Фонд перспективных исследований, Геоинформационные сервисы, геолокация, ДЗЗ, машинное обучение, обработка изображений, Программирование, сколково, ФПИРазработка интеллектуальных систем распознавания данных становится все более актуальной по мере развития интернета вещей и стремительного увеличения количества информации, которую собирают и которой обмениваются устройства: от камер систем безопасности до спутников, производящих съемку поверхности Земли. Однако анализ этой информации и последующее принятие решений пока остается за человеком: в силу естественных ограничений он не может быстро обрабатывать большие объемы данных и поэтому остается “узким местом” в процессе сбора и управления информацией.
[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1
2016-10-26 в 16:44, admin, рубрики: deep learning, machine learning, neural networks, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучение![[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1 - 1 [ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1 - 1](https://www.pvsm.ru/images/2016/10/26/v-zakladki-zoopark-arhitektur-neironnyh-setei-chast-1.png)
За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.
Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.
Читать полностью »
Машинное обучение и Intel Xeon: рекомендательная система для внутриигровых покупок Tencent
2016-10-26 в 12:09, admin, рубрики: Intel MKL, intel xeon, Блог компании Intel, машинное обучение, разработка игр, рекомендательные системыВ наши дни онлайн-игры весьма популярны, особенно среди молодёжи. Играми занимают свободное время, нередко виртуальными соратниками или врагами становятся члены семей или друзья. Во многих случаях игрокам нужно что-либо покупать для того, чтобы улучшить своего персонажа и получить преимущество перед другими геймерами.

— Лошадью ходи, век воли не видать!
Для того, чтобы усовершенствовать способы взаимодействия с пользователями, Tencent внедрила рекомендательную систему. Эта система построена на основе методов машинного обучения и призвана помогать пользователям принимать решения о внутриигровых покупках.
Читать полностью »
Automatic Relevance Determination или машинное обучение когда данных очень мало
2016-10-26 в 6:59, admin, рубрики: bayes, bayesian inference, data mining, feature selection, linear model, linear regression, python, scikit-learn, линейная регрессия, математика, машинное обучениеКогда речь заходит про машинное обучение, обычно подразумевают большие объемы данных — миллионы или даже миллиарды транзакций, из которых надо сделать сложный вывод о поведении, интересах или текущем cостоянии пользователя, покупателя или какого-нибудь аппарата (робота, автомобиля, дрона или станка).
Однако в жизни обычного аналитика самой обычной компании много данных встречается нечасто. Скорее даже наоборот — у вас будет мало или очень мало данных — буквально десятки или сотни записей. Но анализ все же нужно провести. Причем не какой попало анализ, а качественный и достоверный.
Зачастую ситуация усугубляется еще и тем, что вы без труда можете нагенерить для каждой записи много признаков (чаще всего добавляют полиномы, разницу с предыдущим значением и значением за прошлый год, one-hot-encoding для категориальных признаков и т.п.). Вот только совсем нелегко разобраться, какие из них действительно полезны, а какие только усложняют модель и увеличивают ошибки вашего прозноза.
Для этого вы можете воспользоваться методами байесовой статистики, например, Automatic Relevance Determination. Читать полностью »




