
Зачем мозгу предсказывать слова
Мы редко слушаем речь как поток неожиданных звуков. постоянно строит догадки о следующем слове и проверяет себя по мере поступления звука. Такой режим экономит силы: чем точнее ожидание, тем меньше усилий на распознавание. Есть много данных о предсказаниях в зрении и слухе, но семантика — смысл слов — долго оставалась тяжелой задачей. Авторы исследования предприняли важный шаг: показали, что предсказуемость слов, оцененная большой языковой моделью на базе BERT, согласуется с нервными ответами людей, когда они слушают естественную речь — аудиокнигу на немецком.
Как проверяли гипотезу в реальном прослушивании
29 участников лежали в магнитном томографе и слушали аудиокниги около 50 минут. Исследователи одновременно записывали MEG и EEG, чтобы увидеть и когда, и где в
Как LLM помогла измерить ожидаемость
Чтобы количественно оценить, насколько слово ожидаемо, авторы взяли BERT для немецкого языка и для каждого существительного в тексте рассчитали вероятность того, что именно это слово должно стоять на месте маски. По сути, модель мира с одной текстовой модальностью, выученная BERT на больших корпусах, давала численную оценку предсказуемости.

Авторов интересовали прежде всего существительные — носители значимой части смысла. Они сравнивали группы слов с высокой и низкой предсказуемостью и отдельно проверяли плавные, ступенчатые зависимости, разбив весь диапазон на десять равных по количеству примеров интервалов.
Что показали мозговые сигналы
Результат получился очень согласованный. Чем выше предсказуемость по BERT, тем слабее N400 в EEG —
Откуда в мозге идут эффекты
Авторы восстановили источники активности в коре. После начала слова более сильные ответы для непредсказуемых существительных шли из теменных и сенсомоторных областей. Это может означать, что когда слово не угадывается,
Важно, что зависимости оказались плавными. Если разбить все слова на десять ступеней по предсказуемости, амплитуда N400 равномерно убывает от низкой к высокой предсказуемости, а предстимульная активность — напротив, растет. Между силой предвосхищающего сигнала и размером последующего N400 есть отрицательная связь: лучше подготовился — меньше нужно дообрабатывать.
Почему это важно для нейронаук и ИИ
Эта работа показывает, что оценки предсказуемости из BERT действительно резонируют с тем, как
Так
***
Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал - там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.
Автор: andre_dataist
