Модель функционального разделения сознания и бессознательного. Введение

в 23:15, , рубрики: искусственные нейронные сети, искусственный интеллект, Философия ИИ, метки: ,

В последние время на хабре по теме ИИ начали появляться сильно легковесные статьи, это точнее даже не про ИИ, а про философию ИИ. Причем такую философию, которая не ставит НИ КАКИХ принципиальных вопросов перед исследователями. Ну, скажем так это просто трёп за жизнь. И что удивительно такие статьи набирают некоторое количество плюсов.

Какие статьи я имею введу? Дам только названия, без ссылок т.к. не рекомендую их читать (Еще одна попытка разобраться в проблеме искусственного интеллекта, О возможности ИИ к самопознанию и познанию создателя, Об эмоциях, программах и искусственном интеллекте, Искусственному интеллекту быть, Взгляд хорошо информированного скептика на искусственный интеллект)

Понятно, что такие статьи писали те кто даже близко не имеет соответствующего образования. Но не это главная причина появления подобных статей. Ведь они действительно публикуя такие статьи думают, что это может хоть как то направить исследователя, который имеет соответствующие образование. Я их разочарую — нет не направит, т.к. в статьях нет ни одной идеи куда. А происходит это (появление подобного трепа) от того, что им кажется, что исследователи сами не знают куда им развиваться. И это порой выглядит именно так. Даже в профессиональной среде ИИ-специалистов часто нет понимания какие задачи надо решать, нет так сказать «списка нерешенных ИИ-проблем», в отличии от математики. Книги часто содержат лишь методы решения задач, и практически ничего не говорят о задачах которые надо еще решить. Подрастающему поколению сложно поставить себе задачу, и они начинают фантазировать исходят только из слова «интеллект». Но все наверное забыли/(не знают?), что название «Искусственный интеллект» — это провокация, рекламный трюк — серьезные ученые не занимаются «сильным ИИ», и не потому, что его нельзя сделать, а потому как это не имеет технической постановки.

Здесь я дам отрефакторинную версию одной моей научно-популярной статьи 2006 года, которая как я думал стоит в том же ряду по смысловой нагрузке, как те которые выше я критиковал. Но теперь я все же вижу, что стилистика хоть и такая же, но за моей статьей может стоять (и стоит) четкая техническая постановка. О ней мы поговорим позже, а пока так сказать лирическое вступление. Но важно то, что я лирически подвожу к одной существенной нерешенной проблеме из области ИИ.

Вначале необходимая теория. Кто знаком с перцептроном Розенблатта, может лишь подивится его лирическому описанию для публики. И уделить основное внимание лишь одному важному аспекту описаному в разделе «Проблема обучения от двух и более учителей» — это не решенная по сей день проблема ИИ.

Модель памяти

Вначале читателю нужно отказаться от того мнения, что память человека, сходна с компьютерной, т.е. то что записывается, то потом можно считать в неизменном виде. И кроме того, что запись в памяти имеет четко локализованное место. Это все далеко не так!

Итак, первое, распределенность – основная характеристика памяти. Имеет ряд следствий:
1. Память не статична, она динамична. Конкретный факт распределен в памяти и постоянно меняет места;
2. Так как факт не имеет точно локализованного места, то такая память более надежна (и не обязательно избыточна). Потеря какого-либо элемента памяти ухудшает лишь качество запомненных фактов, но не приводит к полной потери факта.

Вторая характеристика – ассоциативность. Рассмотрим вначале вырожденные случаи, когда модель памяти имеет одну характеристику, но не имеет другой:
1. Распределенная, но не ассоциативная память. Известна в программировании как распределенная база данных.
2. Не распределенная ассоциативная память. Известна как прямой (или обратный) логический вывод, используемый в экспертных системах.

Что же добавляет ассоциативность к свойствам распределенности:
1. Объединяет распределенные элементы в единое целое;
2. Позволяет объединить распределенные элементы в такой комбинации, которая ранее не была предусмотрена;
3. Новые комбинации могут объединяться в ответ на ранее неизвестный стимул, т.е. как бы предугадывая ответ (прогнозирование).

Таким образом, распределенность является необходимым условием, а ассоциативность достаточным условием для возникновения эффекта предвидения (прогнозирования).

Эффект предвидения можно считать проявлением интуиции. Он считается необходимой частью интеллектуальной деятельности. И относиться скорее к проявлению бессознательного, чем сознания.

Осознанное прогнозирование имеет другие проявления – оно не может быть основано на распределенности и ассоциативности. Оно имеет детерминированный характер и конкретную направленность. Такое прогнозирование основано на четких аналитических формулах.

Здесь же мы далее будем говорить о бессознательном прогнозировании, которое является одним из эффектов возникающих в распределенной и ассоциативной памяти.

Мозг человека способен осознать только простые линейные закономерности. Мы ни когда не работаем со сложными системами, мы раскладываем их на простые системы и отдельно рассматриваем отношения между этими простыми системами. Весь объектно-ориентированный анализ построен на этом принципе.

Мы не способны оперировать характеристиками, которые в сложных комбинациях дают один тип явлений, а в других сложных комбинациях дают другой тип явлений. Мы можем рассуждать лишь в терминах – если присутствует эта и эта характеристика, то явление такое-то. В реальности же такой простоты не существует, если бы мы не смогли бы найти механизм абстрагирования от сложности нам пришлось бы рассуждать так – если есть эта и эта характеристика, и отсутствует эта и эта, то в данном конкретном случае это такой-то тип явления. Но такое рассуждение не может быть обобщенно, а это означает, что теряется любая надежда на прогнозирование.

Но память человека и здесь постаралась, и предъявила нам принцип двухслойности – третья характеристика памяти. Это означает, что мозг не воспринимает первичные стимулы (сигналы) из внешнего мира. Он отображает эти стимулы на поле своих элементов памяти. В результате этого отображения изначальные нелинейные стимулы преобразуются совсем в другой набор уже линейных стимулов.

Для возможности выполнения принципа двухслойности необходимо реализовать в модели памяти нелинейную функцию отображения. Для чего становиться ясно из следующей математического принципа:
Принцип отображения нелинейности в линейность. Любое нелинейное множество характеристик отраженное с помощью любой нелинейной функции на множество большее по объему на одну размерность (т.е. если объем исходного бинарного множества 256, то объем конечного множества 256^2) линейно разделимо.

Итак, в чем же проявляется эта третья характеристика памяти – двухслойность:
1. Мы уже упоминали, возможность абстрагирования от сложности;
2. Благодаря этой характеристики, мы смотрим на мир в “розовых очках”. Мы не видим его непосредственной сложности, мы не видим того хаоса, который здесь присутствует – весь хаос уже убран и предстает перед нами уже как осознанный миропорядок. Многие захотели бы снять эти “очки”, увидеть жизнь во всей ее сложности, но эту функцию взял за нас наш организм – он занимается всеми частностями – сколько таких-то и таких-то веществ нам нужно, это и есть функция бессознательного и инстинктов. И если мы вынесем это на уровень сознания (хоть это и не возможно) мы деградируем, и не только потому, что у нас не будет времени на творчество, а потому что мы не сможем возвыситься над частностями, сложность не позволит нам видеть дальше. Но зато мы вынуждены видеть мир искаженным, т.е. правильным как он пред нами предстает;
3. К сожалению, эта характеристика проявляет себя также отрицательно. Необходим больший на порядок объем памяти, чем воспринимаемый мир стимулов. Правда это объем более простого устройства, чем те взаимоотношения между входными стимулами среды. Точнее элементы памяти непосредственно не связанны между собой, между ними нет взаимоотношений, поэтому сами по себе они просты. Именно их объем позволяет разложить сложные взаимоотношения между воспринимаемыми стимулами. Ведь известно, математическое правило, согласно которому число промежуточных вычислений зависит и сильно больше числа входов/выходов. Т.е. чтобы вычислить задачу требуется большой объем промежуточной памяти.

Модель обучения (условный рефлекс)

При обучении происходит запись на распределенную память. Этот процесс записи сильно отличается от мгновенной записи в локализованное место памяти, как это имеет место быть при записи информации на диск компьютера. Заранее не известно в какие элементы нужно записать различные части записываемого факта. Неизвестно даже как нужно этот факт поделить.

С одной стороны, принято говорить, что стимул (факт) вызывает определенную активность в элементах памяти. Это следствие реакции, которая появляется как внешнее проявление процесса перехода от нелинейности к линейности. Если реакция была бы простой линейной — мы имели бы безусловный рефлекс. А так как мы хотим реагировать на нелинейный мир мы биологически вынуждены использовать память, с описанными выше харакетристиками. С другой стороны, сам обучаемый или «учитель» определяет какую реакцию нужно ждать от возникновения определенного стимула. Другими словами, при обучении указывается ( в более серьезных моделях прогнозируется) какому типу явлений (классу) принадлежит данный факт (стимул).

Таким образом, соотнесение активности памяти с получаемыми указаниями является сутью обучения.

Возникаемая активность памяти (псевдослучайно, т.к. подчиняется все-таки определенному закону формирования, но для конкретного стимула выбирается случайно) указывает на каких элементах нужно записать факт – на активных элементах памяти.

Далее остается вопрос как распределить информацию о факте? Математически это вопрос решения системы уравнений – большого числа уравнений, которые требуется между собой согласовать.

Проблема обучения от двух и более учителей

Другой важный момент в теории обучения, состоит в способности вырабатывать свое мнение на основе обучения от нескольких разных учителей. Помним, что в более сложном случае это не внешний учитель, а собственная интуиция, но она не однозначно может прогнозировать, а указывать, что это может быть 2 и более подходящих ответа, и все они правильны, но даны с разных точек зрения.

Аппроксимация, нахождение среднего между мнениями разных учителей еще нельзя назвать выработкой своего мнения. Свое мнение появляется когда за основу выбирается некоторое общее положение, которое в принципе объединяет два или более мнения учителей хотя бы в ограниченной области. Т.е. происходит подменна стимулов инициированных учителями на собственные стимулы, которые и берутся за основу. Если удается при этом обучиться и получить результат сходный с результатом учителей, то можно говорить о выработке своего мнения.

Или в более сложном случае, находится некоторый закон, которых объединяет правильные ответы, но это происходит путем больших умственных усилий и как правило не используется в повседневной жизни, а попадает на страницы статей или учебников. Вот это и есть проявление интеллекта — это и только это, остальное же затрагиваемое здесь — есть лишь элементы органической жизни.

При этом при обучении могут выявится противоречия, которые имеются в картине предлагаемой одним и тем же учителем. Это указывает на то, что по мнению обучаемого картина предлагаемая учителем не точна, и здесь может применяться аппроксимация, но не между мнениями разных подходов (учителей), а между одним и тем же подходом, но в разных ситуациях. Т.е. по мнению обучаемого учитель поступает по разному в одинаковых ситуациях, но только не видит, что ситуации разные. Такой эффект происходит из-за того, что обучаемый изначально выбрал несколько другие основные положения, и при обучении подменял стимулы учителя своими. Описанный процесс обучения полезен как формирование новых знаний, появление различных углов зрения на один и тот же процесс … и главное, такое обучение может быть промоделировано и автоматизировано.

Получается как-то много текста, поэтому разделю на две части. В следующей части мы непосредственно перейдем к определению сознания и тому, что это означает для искусственных нейронных сетей. Т.е. продолжение следует

Автор: tac

* - обязательные к заполнению поля