Рубрика «обучение с подкреплением» - 2

DeepMind и Google: битва за контроль над сильным ИИ

2019-03-18 в 13:00, admin, рубрики: AGI, DeepMind, Republic: The Revolution, Theme Park, будущее здесь, Демис Хассабис, искусственный интеллект, Киберпанк, мозг, научная фантастика, обучение с подкреплением, сильный ИИ, символический ИИ, Сингулярность, Совет по этике, футурология

DeepMind и Google: битва за контроль над сильным ИИ - 1
Демис Хассабис основал компанию по созданию самого мощного в мире ИИ. Затем её купила Google

В августе 2010 года в конференц-зале в пригороде Сан-Франциско на сцену вышел 34-летний лондонец по имени Демис Хассабис. Он вышел неторопливой походкой человека, который пытается контролировать нервы, сжал губы в краткой улыбке и начал: «Итак, сегодня мы поговорим о разных подходах к разработке...» — тут запнулся, словно вдруг осознав, что озвучивает потаённые честолюбивые помыслы. Но потом всё-таки сказал: «… сильного ИИ».

Сильный ИИ (artificial general intelligence или AGI) означает универсальный искусственный интеллект — гипотетическую компьютерную программу, способную выполнять интеллектуальные задачи как человек или даже лучше. Сильный ИИ сможет выполнять отдельные задачи, такие как распознавание фотографий или перевод текста, которые являются единственными задачами каждого из слабых ИИ в наших телефонах и компьютерах. Но он также будет играть в шахматы и говорить по-французски. Будет понимать статьи по физике, сочинять романы, разрабатывать инвестиционные стратегии и вести восхитительные беседы с незнакомыми людьми. Он будет следить за ядерными реакциями, управлять электросетями и транспортными потоками и без особых усилий преуспеет во всём остальном. AGI сделает сегодняшний самый продвинутый ИИ похожим на карманный калькулятор.
Читать полностью »

Нейросеть AlphaStar обыграла профессионалов StarCraft II со счётом 10−1

2019-01-25 в 15:39, admin, рубрики: AlphaStar, DeepMind, StarCraft II, Игры и игровые приставки, искусственный интеллект, машинное обучение, обучение с подкреплением

Нейросеть AlphaStar обыграла профессионалов StarCraft II со счётом 10−1 - 1

DeepMind, дочерняя компания Alphabet, которая занимается исследованиями в области искусственного интеллекта, объявила о новой вехе в этом грандиозном квесте: впервые ИИ обыграл человека в стратегии Starcraft II. В декабре 2018 года свёрточная нейросеть под названием AlphaStar размазала профессиональных игроков TLO (Дарио Вюнш, Германия) и MaNa (Гжегож Коминц, Польша), одержав десять побед. Об этом событии компания объявила вчера в прямой трансляции на YouTube и Twitch.

В обоих случаях и люди, и программа играли за протоссов. Хотя TLO не специализируется на этой расе, но зато MaNa оказал серьёзное сопротивления, а потом даже выиграл одну игру.
Читать полностью »

Как я научила робота бегать по видео с YouTube

2019-01-25 в 9:58, admin, рубрики: hse, jetbrains, jetbrains research, Алгоритмы, Блог компании Питерская Вышка, искусственный интеллект, машинное обучение, обучение с подкреплением, питерская вышка, Учебный процесс в IT

Мы продолжаем рассказывать о совместных научных проектах наших студентов и JetBrains Research. В этой статье поговорим об алгоритмах глубокого обучения с подкреплением, которые используются для моделирования двигательного аппарата человека.

Смоделировать все возможные движения человека и описать все сценарии поведения — достаточно сложная задача. Если мы научимся понимать, как человек двигается, и сможем воспроизводить его движения «по образу и подобию» — это сильно облегчит внедрение роботов во многие области. Как раз для того, чтобы роботы учились повторять и анализировать движения сами, и применяется машинное обучение.

Как я научила робота бегать по видео с YouTube - 1
Читать полностью »

Что не так с обучением с подкреплением (Reinforcement Learning)?

2019-01-21 в 23:25, admin, рубрики: reinforcement learning, искусственный интеллект, машинное обучение, нейронные сети, обучение с подкреплением

Что не так с обучением с подкреплением (Reinforcement Learning)? - 1

Еще в начале 2018 года вышла статья Deep Reinforcement Learning Doesn't Work Yet ("Обучение с подкреплением пока не работает"). Основная претензия которой сводилась к тому, что современные алгоритмы обучения с подкреплением требуют для решения задачи примерно столько же времени, как и обычный случайный поиск.

Изменилось ли что-то с того времени? Нет.

Обучение с подкреплением считается одним из трех основных путей к созданию сильного ИИ. Но трудности, с которыми сталкивается эта область машинного обучения, и методы, которыми ученые пытаются бороться с этими трудностями, наводят на мысль что, возможно, с самим этим подходом имеются фундаментальные проблемы.

Читать полностью »

Улучшение агента на основе Q-Learning, торгующего stocks, путем добавления рекуррентности и формирования наград

2019-01-18 в 12:26, admin, рубрики: R, машинное обучение, обучение с подкреплением

Напоминание

Привет! Предлагаю вашему вниманию ещё один перевод моей новой статьи с медиума.

В прошлый раз (первая статья) (Habr) мы создали агента на технологии Q-Learning, который совершает сделки на имитированных и реальных биржевых временных рядах и пытались проверить, подходит ли эта область задач для обучения с подкреплением.

В этот раз мы добавим LSTM слой для учета временных зависимостей внутри траектории и сделаем инженерию наград (reward shaping) на основе презентаций.

Читать полностью »

Как учиться с помощью машинного обучения у экспертов в Dota 2

2019-01-10 в 13:00, admin, рубрики: hse, jetbrains, jetbrains research, Алгоритмы, Блог компании Питерская Вышка, демонстрации, искусственный интеллект, машинное обучение, обучение с подкреплением, питерская вышка, Учебный процесс в IT

В предыдущей статье от Питерской Вышки мы показывали, как при помощи машинного обучения можно искать баги в программном коде. В этом посте расскажем о том, как мы вместе с JetBrains Research пытаемся использовать один из самых интересных, современных и быстроразвивающихся разделов машинного обучения — обучение с подкреплением — как в реальных практических задачах, так и на модельных примерах.

Как учиться с помощью машинного обучения у экспертов в Dota 2 - 1

Читать полностью »

Обучение с подкреплением на языке Python

2018-12-28 в 14:30, admin, рубрики: OpenAI Gym, python, RL, Алгоритмы, Блог компании Издательский дом «Питер», глубокое обучение, книги, машинное обучение, обучение с подкреплением, Профессиональная литература

Привет, коллеги!

Обучение с подкреплением на языке Python - 1

В последней публикации уходящего года мы хотели упомянуть о Reinforcement Learning — теме, книгу на которую мы уже переводим.

Посудите сами: нашлась элементарная статья с Medium, в которой изложен контекст проблемы, описан простейший алгоритм с реализацией на Python. В статье есть несколько гифок. А мотивация, вознаграждение и выбор правильной стратегии на пути к успеху — это вещи, которые исключительно пригодятся в наступающем году каждому из нас.

Приятного чтения!
Читать полностью »

Можно ли обучить с подкреплением агента для торговли на рынке акций? Реализация на языке R

2018-12-14 в 14:59, admin, рубрики: R, машинное обучение, обучение с подкреплением

Давайте создадим прототип агента обучения с подкреплением (RL), который овладеет навыком трейдинга.

Учитывая, что реализация прототипа работает на языке R, я призываю пользователей и программистов R приблизиться к идеям, изложенным в этом материале.

Это перевод моей англоязычной статьи: Can Reinforcement Learning Trade Stock? Implementation in R.

Хочу предупредить код-хантеров, что в этой заметке есть только код нейронной сети, адаптированной под R.

Если я не отличился хорошим русским языком, укажите на ошибки (текст готовился с подмогой автоматического переводчика).

Читать полностью »

Учим агента играть в Mario Kart с помощью фильтров

2018-11-12 в 9:44, admin, рубрики: Блог компании Smile-Expo, игровой ии, искусственный интеллект, машинное обучение, обучение нейронных сетей, обучение с подкреплением, смайл экспо

Владимир Иванов vivanov879, Sr. Deep Learning Engineer в NVIDIA, продолжает рассказывать про обучение с подкреплением. В этой статье речь пойдет про обучение агента для прохождения квестов и о том, как нейросети используют фильтры для распознавания изображений.

В предыдущей статье разбиралось обучение агента для простых стрелялок.

Про применение обучения с подкреплением на практике Владимир будет рассказывать на AI Conference 22 ноября.Читать полностью »

Обучение с подкреплением в среде PyBullet

2018-08-22 в 17:41, admin, рубрики: PyBullet, машинное обучение, обучение с подкреплением, симуляция физики

Многие, кто изучает машинное обучение, знакомы с проектом OpenAI, одним из основателей которого является Илон Маск, и используют в качестве среды для тренировки своих моделей нейронных сетей платформу OpenAI Gym.

Gym содержит огромный набор окружений, часть из них — различного рода физические симуляции: движения животных, человека, роботов. Данные симуляции основаны на физическом движке MuJoCo, который является бесплатным для образовательных и научных целей.

В данной статье мы создадим предельно простую физическую симуляцию подобную окружению OpenAI Gym, но основанную на свободном физическом движке Bullet(PyBullet). А так же создадим агента для работы с этим окружением.
Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «обучение с подкреплением» - 2

DeepMind и Google: битва за контроль над сильным ИИ

Нейросеть AlphaStar обыграла профессионалов StarCraft II со счётом 10−1

Как я научила робота бегать по видео с YouTube

Что не так с обучением с подкреплением (Reinforcement Learning)?

Улучшение агента на основе Q-Learning, торгующего stocks, путем добавления рекуррентности и формирования наград

Напоминание

Как учиться с помощью машинного обучения у экспертов в Dota 2

Обучение с подкреплением на языке Python

Можно ли обучить с подкреплением агента для торговли на рынке акций? Реализация на языке R

Учим агента играть в Mario Kart с помощью фильтров

Обучение с подкреплением в среде PyBullet

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «обучение с подкреплением» - 2

Напоминание

Новости

Актуальные темы

Архив