Рубрика «обучение нейросетей»

Современное обучение нейросетей часто напоминает алхимию. У нас есть работающие рецепты, но как именно статистическая модель превращает терабайты текста в понимание до сих пор непонятно.

Почему возможно сублиминальное обучение (передача паттернов через шум)? Почему обучение на синтетических данных приводит к деградации, даже если данные кажутся качественными? 

Читать полностью »

Когда речь идет про моделирование работы мозга, то возникает проблема «не видеть лес за деревьями». Модель каждого, взятого по отдельности нейрона, может работать достаточно хорошо. Можно даже связать их в достаточно стабильную нейронную цепь. Но дальнейшее моделирование «поведения, близкого к реальному», становится вызовом. До сегодняшнего дня.

Читать полностью »
Не лезьте туда: 47 лет не оцифровывали, и нормально же работало - 1

Выпуск чугуна из доменной печи. Один из процессов, вокруг которого будем вести диалог.

С точки зрения ИТ доменная печь — это огромный «чёрный ящик». Вы кладёте сырьё и топливо, получая на выходе чугун и шлак. Измерить внутри все можноЧитать полностью »

Тема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область, постоянно расширяющая границы того, что могут видеть и понимать машины.

Однако, зачастую многие публикации посвященные computer vision являются достаточно сложными для тех, кто только погружается в данную тему.

Читать полностью »

Все эти игры не для нас....

Все эти игры не для нас....

Хотелось быпоказать «суть» метода обратного распространения ошибки (Backpropagation) в нейросетях. Ведь ее сложно увидеть за нагромождением формул. Статья, конечно, не для профессионалов индустрии и математиков... Но знать производные нужно.

Читать полностью »

В 2016 году я наткнулся на руководство по стратегиям сбора данных для AI-стартапов, многие идеи из которого были визионерскими для своего времени. Автором этого текста был Мориц Мюллер-Фрайтаг, сооснователь компании Twenty Billion Neurons (TwentyBN).

Как собирать данные: руководство для ИИ-стартапов - 1

Читать полностью »

LLM будут врать вечно - 1

Сможем ли мы когда-нибудь доверять искусственному интеллекту? 

Читать полностью »

«А можно быстрее?»: разбираем методы ускорения обучения нейронных сетей - 1

Современные нейросетевые архитектуры достигают впечатляющих результатов в сложных задачах ИИ благодаря росту объемов данных и вычислительных мощностей. Однако обратной стороной медали стала высокая ресурсоемкость обучения.

Например, последняя версия GPT-4 от OpenAI обучалась на большом GPU-кластере. Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js