Компания Мастер Кит, выпускающая серию наборов для начинающих под общим названием «Азбука электронщика», конечно же, не могла обойти вниманием такой известный компонент, как «легендарный» интегральный таймер NE555. И, если в первом наборе «Основы схемотехники», рассматриваются 15 простейших схем с применением основных электронных компонентов (резисторов, конденсаторов, транзисторов, диодов), то в наборе, который мы назвали «Классика схемотехники», приведены 20 схем с применением таймера NE555.
Рубрика «обучение с подкреплением» - 4
Три пятерки для электронщика
2015-11-26 в 7:53, admin, рубрики: diy или сделай сам, Блог компании Мастер Кит, мастер кит, обучающий материал, обучение с подкреплением, схемотехника, Электроника для начинающихИИ от Google самостоятельно освоил 49 старых игр Atari
2015-02-26 в 9:17, admin, рубрики: Atari 2600, Google, Google DeepMind, игры, искусственный интеллект, Научно-популярное, обучение с подкреплением, метки: Atari 2600, Google DeepMind
Компания Google создала систему искусственного интеллекта, которая играет лучше человека во многие аркадные игры. Программа научилась играть, не зная правил и не имея доступа к коду, а просто наблюдая за картинкой на экране.
Читать полностью »
Логические уровни обучения и психотерапия
2013-02-18 в 9:04, admin, рубрики: кибернетика, коучинг, Научно-популярное, обучение, обучение с подкреплением, Песочница, психология, психотехника, Учебный процесс в IT, метки: кибернетика, коучинг, обучение, обучение с подкреплением, психология, психотехникаКоучинг не учит, а помогает учиться.
Тимоти Голви
Мы можем учиться, учиться,
может быть, учиться учиться.
Грегори Бейтсон
Грегори Бейтсон — один из наиболее влиятельных мыслителей нашего времени (по мнению Фритьофа Капры, «Дао физики»), работы которого соединяют знания из эпистемологии, кибернетики, антропологии, психологии, экологии. Одним из самых фундаментальных концептов Бейтсона является идея о логических уровнях обучения и коммуникации.
Основание ее лежит в теории логических типов Бертрана Рассела, которая коротко может быть изложена следующим образом: все объекты мышления организованы в своеобразную иерархию, к нулевому типу которой относятся индивидуальные объекты (например, ложка). К первому типу относятся множества объектов нулевого типа (например, ложки как множество); ко второму — множества множеств этих объектов (например, «столовые приборы» как множество, которое объединяет ложки, вилки, ножи и другие приборы) и т. д. Таким образом проводится строгое разграничение между предметами, свойствами предметов, свойствами свойств предметов и т. д.
Многорукие бандиты: модель dynamic Gamma-Poisson
2013-02-15 в 16:11, admin, рубрики: surfingbird, Алгоритмы, Блог компании Surfingbird, искусственный интеллект, многорукие бандиты, обучение с подкреплением, рекомендательные системы, метки: surfingbird, Алгоритмы, многорукие бандиты, обучение с подкреплением, рекомендательные системыВ прошлый раз мы рассмотрели общую постановку задачи о многоруких бандитах, обсудили, зачем это может быть нужно, и привели один очень простой, но эффективный алгоритм. Сегодня я расскажу о ещё одной модели, которая эффективна в ситуациях, когда ожидаемые доходы от бандитов меняются со временем, да и само число и состав «ручек» может меняться – о динамической гамма-пуассоновской модели.
Многорукие бандиты: введение и алгоритм UCB1
2013-02-07 в 9:57, admin, рубрики: surfingbird, Алгоритмы, Блог компании Surfingbird, искусственный интеллект, многорукие бандиты, обучение с подкреплением, рекомендательные системы, метки: surfingbird, Алгоритмы, многорукие бандиты, обучение с подкреплением, рекомендательные системыЭто первый пост из блога Surfingbird, который я выношу в общие хабы алгоритмов и искусственного интеллекта; честно говоря, раньше просто не догадался. Если интересно, заходите к нам, чтобы прочесть предыдущие тексты, – я не знаю, что произойдёт, если просто добавить новые хабы к постам несколькомесячной давности.
Краткое содержание предыдущих серий о рекомендательных системах:
- рекомендательные системы: постановка задачи;
- user-based и item-based коллаборативная фильтрация;
- SVD, часть I;
- SVD и базовые предикторы;
- SVD на Perl;
- оверфиттинг и регуляризация;
- теорема Байеса и наивный Байес;
- LDA (Latent Dirichlet allocation, тематическое моделирование).
В этот раз начинаем новую тему – о многоруких бандитах. Бандиты – это самая простая, но от этого только более важная постановка задачи в так называемом обучении с подкреплением…
Обучение с подкреплением на нейронных сетях. Теория
2012-08-01 в 2:28, admin, рубрики: Алгоритмы, искусственные нейронные сети, искусственный интеллект, обучение с подкреплением, Спортивное программирование, метки: искусственные нейронные сети, обучение с подкреплениемЯ тут написал статью Проблема «двух и более учителей». Первые штрихи, пытаясь показать одну сложную нерешенную проблему. Но первые штрихи оказались немного за сложными. Поэтому я решил для читателей немного разжевать теорию. Увы, сейчас видимо учат/(учатся ?) несколько шаблонно — типа как для каждой задачи свои методы.
Так мне указали, что для задачи классификации — нейронные сети (обучение с учителем), генетические алгоритмы (обучение без учителя) — задача кластеризации, а еще есть обучение с подкреплением (Q-обучение) — как задача агента, которых бродит и что-то делает. И вот такими шаблонами многие и судят.
Попробуем разобраться, что дает применение нейронных сетей, как некоторые заявляют, к задаче которую они не могут решить — а именно к обучению с подкреплением.
И заодно проанализируем диссертацию Бурцев М.С., «Исследование новых типов самоорганизации и возникновения поведенческих стратегий», в которой не больше не меньше красиво сделано именно применение простеньких нейронных сетей в задаче обучения с подкреплением.