Главная

Рубрика «deepmind lab»

Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи

2018-11-05 в 9:46, admin, рубрики: ALE, CommAI, deepmind lab, Gym, Gym Retro, Malmo, Random Network Distillation, RND, unity, Universe, Игры и игровые приставки, искусственный интеллект, машинное обучение, Месть Монтесумы

Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи - 1
Прогресс в игре «Месть Монтесумы» многими рассматривался как синоним достижений в области исследования незнакомой среды

Мы разработали метод случайной дистилляции сети (Random Network Distillation, RND) на основе прогнозирования, который поощряет агентов обучения с подкреплением исследовать окружение благодаря любопытству. Этот метод впервые превысил средние результаты человека в компьютерной игре «Месть Монтесумы» (если не считать анонимную заявку в ICLR, где результат хуже нашего). RND демонстрирует ультрасовременную производительность, периодически находит все 24 комнаты и проходит первый уровень без предварительной демонстрации и не имея доступ к базовому состоянию игры.
Читать полностью »

DeepMind открыло бесплатный доступ к виртуальной среде машинного обучения

2016-12-05 в 21:41, admin, рубрики: DeepMind, deepmind lab, Google, игры, искусственный интеллект, Научно-популярное

DeepMind открыло бесплатный доступ к виртуальной среде машинного обучения - 1

На днях представители подразделения DeepMind (сейчас входит в состав холдинга Alphabet) сообщили о предоставлении бесплатного доступа разработчикам к исходному коду платформы DeepMind Lab. Это сервис машинного обучения на базе Quake III, который предназначен для обучения искусственного интеллекта. А именно — научиться решать задачи в трехмерном пространстве без вмешательства человека. Основой платформы является движок игры Quake III Arena.

Внутри игрового мира ИИ получает форму сферы и возможность летать, изучая окружающее пространство. Цель, которую ставят перед собой разработчики — научить слабую форму ИИ «понимать», что происходит и реагировать на различные ситуации, происходящие в виртуальном мире. «Персонаж» может выполнять ряд действий, перемещаться по лабиринту, изучать ближайшее окружение.
Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «deepmind lab»

Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи

DeepMind открыло бесплатный доступ к виртуальной среде машинного обучения

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «deepmind lab»

Новая реализация любопытства у ИИ. Обучение с вознаграждением, которое зависит от сложности предсказать результат выдачи

DeepMind открыло бесплатный доступ к виртуальной среде машинного обучения

Новости

Актуальные темы

Архив