- PVSM.RU - https://www.pvsm.ru -

Мы редко слушаем речь как поток неожиданных звуков. постоянно строит догадки о следующем слове и проверяет себя по мере поступления звука. Такой режим экономит силы: чем точнее ожидание, тем меньше усилий на распознавание. Есть много данных о предсказаниях в зрении и слухе, но семантика — смысл слов — долго оставалась тяжелой задачей. Авторы исследования предприняли важный шаг: показали, что предсказуемость слов, оцененная большой языковой моделью на базе BERT, согласуется с нервными ответами людей, когда они слушают естественную речь — аудиокнигу на немецком.
29 участников лежали в магнитном томографе и слушали аудиокниги около 50 минут. Исследователи одновременно записывали MEG [2] и EEG [3], чтобы увидеть и когда, и где в
Чтобы количественно оценить, насколько слово ожидаемо, авторы взяли BERT для немецкого языка и для каждого существительного в тексте рассчитали вероятность того, что именно это слово должно стоять на месте маски. По сути, модель мира с одной текстовой модальностью, выученная BERT на больших корпусах, давала численную оценку предсказуемости.
Авторов интересовали прежде всего существительные — носители значимой части смысла. Они сравнивали группы слов с высокой и низкой предсказуемостью и отдельно проверяли плавные, ступенчатые зависимости, разбив весь диапазон на десять равных по количеству примеров интервалов.
Результат получился очень согласованный. Чем выше предсказуемость по BERT, тем слабее N400 в EEG —
Авторы восстановили источники активности в коре. После начала слова более сильные ответы для непредсказуемых существительных шли из теменных и сенсомоторных областей. Это может означать, что когда слово не угадывается,
Важно, что зависимости оказались плавными. Если разбить все слова на десять ступеней по предсказуемости, амплитуда N400 равномерно убывает от низкой к высокой предсказуемости, а предстимульная активность — напротив, растет. Между силой предвосхищающего сигнала и размером последующего N400 есть отрицательная связь: лучше подготовился — меньше нужно дообрабатывать.
Эта работа показывает, что оценки предсказуемости из BERT действительно резонируют с тем, как
Так
📜 Полная статья [4]
🤖 Модель [5]
***
Если вам интересна тема ИИ, [6]подписывайтесь на мой Telegram-канал [7] [8]- там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.
Автор: andre_dataist
Источник [9]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/ii/430711
Ссылки в тексте:
[1] Мозг: http://www.braintools.ru
[2] MEG: https://ru.wikipedia.org/wiki/%D0%9C%D0%B0%D0%B3%D0%BD%D0%B8%D1%82%D0%BE%D1%8D%D0%BD%D1%86%D0%B5%D1%84%D0%B0%D0%BB%D0%BE%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%8F
[3] EEG: https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D1%8D%D0%BD%D1%86%D0%B5%D1%84%D0%B0%D0%BB%D0%BE%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%8F#%D1%8D%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D1%8D%D0%BD%D1%86%D0%B5%D1%84%D0%B0%D0%BB%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0
[4] 📜 Полная статья: https://arxiv.org/abs/2506.08511
[5] 🤖 Модель: https://huggingface.co/bert-base-german-cased
[6] : https://t.me/+mP35nQPhgXZmZDYy
[7] подписывайтесь на мой Telegram-канал: https://t.me/+9K8QIuxN9yVjMmFi
[8] : https://t.me/+9nDCqOqSLiM3NTVi
[9] Источник: https://habr.com/ru/articles/947058/?utm_campaign=947058&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.