Продолжая тему, затронутую в статье об искусственном интеллекте и здравом смысле, хочу затронуть два принципиальных, но зачастую упускаемых из виду отличия от искусственной нейронной сети. Во-первых, нейронная сеть состоит исключительно из «нейронов», а

Вот как выглядят культуры шести основных типов клеток, входящих в состав 
|
Перициты |
Клетки, входящие в состав мелких кровеносных сосудов (капилляров) и гематоэнцефалического барьера. |
|
Астроциты |
Глиальные клетки, обладающие множеством отростков, окружающие нейроны и синапсы. |
|
Нейроны |
Нервная ткань, основная составляющая |
|
Эндотелиальные клетки |
Клетки, выстилающие внутреннюю поверхность кровеносных сосудов |
|
Олигодендроглия |
Мелкие клетки с большим количеством отростков, функционально и морфологически подобные астроцитам, но менее развитые. |
|
Микроглия |
Резидентные макрофаги центральной нервной системы. Распознают различные инородные агенты и борются с патогенами, при чрезмерной активности могут повреждать нейроны и аксоны. |
Таким образом, работа

Благодаря такой форме, астроциты прорастают в мельчайшие полости между нейронами, кровеносными сосудами и синапсами. Они настолько плотно контактируют с синапсами, что напоминают по принципу работы оверлейную сеть, опосредующую контакты между нейронами.

Каждый отдельный астроцит ретранслирует нервные сигналы между миллионами прилегающих к нему синапсов, образуя так называемый «трипартитный синапс». Работая в таких трёхчастных связках, астроциты впитывают часть нейромедиаторов, выделяемых при синаптической передаче сигнала, и определяют силу нейронного взаимодействия. В качестве реакции на эту информацию внутри астроцита колеблется содержание кальция, что запускает каскад биохимических реакций. В качестве обратной связи астроциты подают в синаптическую щель собственные сигнальные вещества, именуемые глиотрансмиттерами.
Версии о том, что астроциты активно участвуют в передаче нейронной информации с участием ионов кальция появились уже в начале нулевых. Каскад реакций, возникающих в ответ на повышение содержания кальция в клетке, приводит к выделению нейромедиаторов, модулирующих работу синапсов, а также влияет на кровоток. Чтобы астроцитарные сигналы работали, нужен запас кальция, и ионы этого металла действительно запасаются в эндоплазматической сети астроцита, а при определённых условиях — высвобождаются. При этом основная цель астроцитов — не информационная, а вспомогательная. Они постоянно обслуживают нейроны, снабжая их энергией и отводя продукты обмена веществ, а также стекаются к месту черепно-мозговых травм, выделяя вещества, необходимые нейронам для восстановления. Таким образом, нейроны и астроциты постоянно взаимодействуют друг с другом, но астроциты остаются инертными к электрическим сигналам на ЭЭГ, из-за чего их роль в функционировании
Однако во второй половине 2010-х эти поиски получили новый импульс благодаря исследованиям с применением новых красителей, чувствительных к кальцию. В присутствии этих красителей удалось как подробно рассмотреть сложную форму астроцитов, так и зафиксировать их активное участие в работе нейронов.
Как я указывал выше, астроциты плотно опутывают синапсы (один астроцит может связывать до 100 000 синапсов). Благодаря этому они тщательно контролируют работу синапсов и вмешиваются в их активность, если синапс начинает сбоить при передаче сигналов. Чтобы уточнить динамику этих процессов, а также лучше понять роль астроцитов в работе

Все эти исследования, продемонстрировавшие теснейшую связь между работой нейронов и астроцитов, натолкнули учёных под руководством Дмитрия Кротова из Массачусетского технологического института (MIT) на идею о том, что именно абстракция, подобная астроцитам, может сыграть ключевую роль в развитии крайне популярных сегодня сетей-трансформеров.
Архитектура трансформеров и стабилизация воспоминаний
В 2014 году была собрана первая искусственная нейронная сеть, работающая по принципу трансформера. Она называлась Seq2Seq (Sequence-to-sequence). Сегодня трансформеры являются наиболее популярной категорией генеративных нейронных сетей и, в частности, больших языковых моделей. Ключевым аспектом трансформера, отличающим его от более ранних архитектур нейронных сетей, является «внимание» (attention). Наиболее популярной современной разновидностью трансформеров являются GPT (generative pretrained transformer), а наряду с ними существуют языковые модели типа BERT (двунаправленные кодирующие представления на основе трансформеров). Недавно в блоге @Sivchenko_translate я публиковал перевод о специфике BERT, вернее, об отличии энкодерного и декодерного подхода к трансформеру. Одно из наиболее парадоксальных свойств трансформера заключается в том, что его (в отличие от других моделей нейронных сетей) пока не удаётся собрать из биологических компонентов.
Вот отличная статья о трансформерах в картинках – перевод от уважаемого Сергея Шкарина @Kouki_RUS В общем виде механизм внимания в трансформерах построен так:

Исходно трансформеры были спроектированы для обработки естественного языка, но в настоящее время также используются применительно к изображениям, речи и аудио. До появления трансформеров нейронные сети приходилось обучать на размеченных датасетах, а их сложно и дорого готовить. Трансформер же способен самостоятельно впитывать огромный набор необработанных данных и самостоятельно разбираться в их внутренней структуре.
Наряду с (многоголовым) вниманием трансформер использует для этого долговременную память и такую абстракцию как «банк памяти». На следующей иллюстрации видим три вентиля: «I» (ввод), «O» (вывод) и «F» (забывание).

Кротов и его группа предположили, что астроцит, имеющий одновременный доступ к миллионам синапсов, может служить буфером памяти, в котором интегрируется информация, поступающая от ближайших нейронов. Проверяя эту гипотезу, Кротов с соавтором, Львом Козачковым и при поддержке Ксении Кастаненко из Гарварда попробовали соотнести базовую архитектуру трансформера с нейронно-астроцитной моделью, применив к ней математику трансформеров. Поэкспериментировав с вариантами ввода и вывода, они предложили модель, иллюстрирующую «запись» информации в астроцит как в долговременную память и чтение из неё.
Чтобы протестировать гипотезу, они залили в модель абстракт собственной статьи, поданной в PNAS, и стали провоцировать отклик астроцитов, измеряя уровни кальция по мере того, как модель обрабатывала токен за токеном. То же самое они проделали с предобученным трансформером для обработки естественного языка, записывая флуктуации внимания и по этим флуктуациям определяя важность каждого слова относительно других слов.
Значительно более интересные данные (как и раз и побудившие меня, наконец, разобрать эту тему на Хабре) получены в течение 2025 года и опубликованы в середине октября группой под руководством Дзюна Нагаи из японского института физико-химических исследований RIKEN. Оказывается, астроциты формируют активный молекулярный ансамбль и действуют в качестве механизма долговременной эмоциональной памяти, закрепляющие и стабилизирующие воспоминания о сильных переживаниях — например, ощущение страха. Астроциты напоминают о пережитом, активируя внутриклеточную систему сигнализации, насыщая при этом
Биологический аналог трансформера
Учитывая эту находку, открывается перспектива создать новую модель ИИ, в которой будет работать не только нейронная, но и астроцитная составляющая. Цифровые астроциты могут отвечать как за долговременное запоминание сигнала, усвоенного на этапе обучения, так и на его активацию (с усилением) в нужных контекстах. В настоящее время эта работа совместно ведётся в ИИ-лаборатории IBM, разработавшей экспертную систему Watson, а также в MIT и в медицинской школе при Гарвардском университете. Теоретически, биологическая сеть из нейронов и астроцитов, даже созданная для проверки концепции, должна решать все те задачи, которые решает трансформер. В то же время, детали работы астроцитов пока не алгоритмизированы, и описать их с вычислительной точки зрения пока сложно. Вот какую аналогию между трансформером и трипартитным синапсом приводят в своей статье Кротов, Козачков и Кастаненко:

Такой «биологически правдоподобный трансформер» может позволить перенести работу GPT на клеточный субстрат, а также объяснить, почему трансформеры настолько успешно справляются с различными творческими задачами.
Как известно, трансформеры отличаются по принципу работы от всех прочих видов нейронных сетей, и всё дело в механизме внимания, который я уже упоминал выше. Например, рекуррентная нейронная сеть (RNN), обученная на корпусе текстов и нацеленная на обработку естественного языка, примеряет каждое слово в высказывании к своему внутреннему состоянию, которое, в свою очередь, зависит от всех других слов, обработанных ею ранее. Трансформер же проделывает такую «примерку» со всеми словами в высказывании сразу, и ему это удаётся благодаря самовниманию.
Чтобы механизм самовнимания работал, трансформер должен держать «в памяти» все слова (токены), с которыми работает. Дмитрий Кротов изучал этот феномен с момента появления первых трансформерных архитектур и пришёл к выводу, что средствами одних только нейронов этого не добиться, поскольку искусственный нейрон не хранит состояния, а срабатывает в ответ на входящие данные. Естественный нейрон, в свою очередь, срабатывает в ответ на раздражитель или, в более широком смысле (электрический) сигнал. Таким образом, в коде традиционной нейронной сети не хватает как кода-нейромедиатора, так и «астроцитного» слоя, который отвечал бы за долговременное удержание и восстановление контекста. Структура, которая решала бы все эти задачи, удивительно напоминает трипартитный синапс.
Астроцит собирает нейромедиаторы, которыми обмениваются синапсы, а в какой-то момент даёт обратную связь нейронам. Сигнал астроцита гораздо более длительный, чем сигнал нейрона, поскольку больше похож не на электрический импульс, а на поток. Поток обеспечивается благодаря тому, что астроцит может медленно наращивать или сбавлять содержание кальция, не прерывая работы по сбору информации от нейронов. Затем она при необходимости или при наступлении момента для разрядки сбрасывается в нейроны. Таким образом, на уровне астроцитов в
С математической точки зрения такие взаимодействия весьма точно описывают модели плотной ассоциативной памяти, расширяющие архитектуру хопфилдовских нейронных сетей. Эти расширения Джон Хопфилд и Дмитрий Кротов совместно разрабатывали примерно с 2016 года. В отличие от традиционной хопфилдовской сети, где синапсы связывают лишь пары нейронов, модели плотной ассоциативной памяти зависят от схождения множества нейронов к общим точкам взаимодействия Такие взаимодействия между чистыми нейронами не возникают, но, судя по опытам in vivo, с высокой вероятностью происходят на уровне астроцитов. В свежем исследовании Кротова, Козачкова и Слотина, вышедшем в мае 2025 года, построена модель, в которой хранение и извлечение данных происходит одновременно с участием нейронов и астроцитов и показано, что информационная ёмкость такой системы гораздо выше, чем у обычной нейронной сети.
Заключение
Все эти выкладки удивительным образом согласуются с современными разработками в области архитектуры нейронных сетей и, в частности, трансформеров. Биологическим аналогом трансформерного «внимания» может быть изменяющийся со временем уровень связности астроцитов, а устройство долговременной памяти с её неосознаваемым компонентом, активируемым, например, во время стресса или гипноза, может соответствовать плотной ассоциативной памяти. Опыты на датасетах CIFAR-10 и Tiny ImageNet показали, что нейронно-астроцитные сети лучше запоминают, воспроизводят и вычленяют сложные узоры даже при частичном сокрытии картинки и общей зашумленности.
Вдобавок к сказанному, нейронно-астроцитная сеть масштабируется лучше, чем обычная нейронка, поэтому открывает новые возможности при проектировании нейроморфных процессоров. Описанные здесь исследования приглашают нас вновь задуматься о природе памяти и позволяют предположить, что воспоминания и опыт распределены в
Автор: OlegSivchenko
