Рубрика «attention»

Вы соревнуетесь не с умными людьми, а с их вниманием, и планка сейчас на дне

2026-03-01 в 13:01, admin, рубрики: attention, ruvds_статьи, бессонница, внимание, мотивация, рассеянность, сон, Стресс, улучшение

Вот я сижу перед чистым листом. Я намерен писать только свои мысли, без постороннего влияния и без лишней спешки. Это должно быть совсем просто.

Мне нужно лишь сосредоточиться...поймать фокус...

Вот, кажется, сейчас... он близко, вот-вот придёт... ещё немного и...

Чёрт. Я не могу...

Читать полностью »

Проблемы людей и нейросетей

2026-02-11 в 18:16, admin, рубрики: attention, llm, rag, агенты, вайбкодинг, галлюцинации, искусственный интеллект, контекст, нейросети, промпт-инжиниринг

Эта статья написана без участия ИИ. Для простых смертных. Упрощена.

Сейчас тренд на замену людей нейросетями, вайбкодинг, и другие вещи, которые завернуты в фантик «Беззаботного будущего», всё это мне напоминает предыдущий тренд, который был до появления ИИ — «Успешный успех». Нам продают не технологии, а чувства простоты, на которое люди каждый раз охотно ведутся.

По ощущениям, это тот же барабан с цифрами 777, нам показывают пару удачных прокруток, «джекпоты», счастливые лица, а реальная статистика, цена попыток, и неизбежные промахи остаются за кадром.

Читать полностью »

Куда и почему уходят бабки на нейросети

2026-01-30 в 15:19, admin, рубрики: attention, chatgpt, claude, CUDA, gpu, inference, kv-cache, llm, transformer, токены

Малоизвестный среди обычных людей факт: у нейросетей нет никаких "разговоров". Ты смотришь в веб-интерфейсе на "диалог" - но это обман, красивый фокус.

Каждый раз, когда ты пишешь новое сообщение, все старые сообщения обрабатываются заново. У нейросетей по-настоящему многоразовых задач не существует. Если результат немного поменялся — тебе просто не покажут в веб-интерфейсе изменившиеся сообщения.

Читать полностью »

Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

2025-12-17 в 15:05, admin, рубрики: attention, llms, natural language processing, nlp, Transformers, глубокое обучение, машинное обучение, механизм внимания, трансформеры

Знание механизма внимания и трансформеров - база любых собеседований на все грейды в NLP!

Статья не рассчитана на изучение тем с нуля, если вы еще не слышали ничего про attention, то лучше обратиться к полноценным лекциям.

Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по NLP, чтобы закрыть пробелы и вспомнить необходимую базу.

Содержание:

Архитектура трансформера
Механизм внимания
Позиционные эмбеддинги
Токенизация
Трансформерные архитектуры (BERT, GPT и тд)
Полезные материалы

Читать полностью »

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

2025-12-16 в 18:37, admin, рубрики: attention, FlashAttention, llm, Transformers, triton, большие языковые модели, внимание, машинное обучение, оптимизация производительности, трансформеры

Читать полностью »

Как сделать нейросети понятнее: эксперимент OpenAI с разреженными моделями

2025-11-14 в 9:57, admin, рубрики: attention, circuits, mechanistic-interpretability, OpenAI, sparse-transformer, архитектура-моделей, интерпретируемость, разреженные-модели, цепочки-вычислений

Команда AI for Devs подготовила перевод исследования OpenAI о том, как обучение разреженных моделей может сделать ИИ более прозрачным. Авторы показывают: если заставить модель использовать меньше связей, внутри неё появляются понятные цепочки вычислений, которые можно изучать и проверять. Это может стать шагом к созданию мощных, но интерпретируемых систем.

Читать полностью »

Momentum Attention: когда внимание получает инерцию

2025-10-27 в 15:58, admin, рубрики: AI, attention, deep learning, machine learning, pytorch, research, Transformers, нейросети

В классическом self-attention каждый токен смотрит на другие токены, чтобы понять, что важно в данный момент.
Внимание распределяется мгновенно:

Momentum Attention: когда внимание получает инерцию - 1

Именно этот механизм сделал трансформеры тем, чем они стали.

Но вот в чём проблема - внимание не имеет памяти.
Читать полностью »

Нейросетевой подход для классификации событий отслеживаемых сверхширокополосным радаром

2025-04-04 в 23:14, admin, рубрики: attention, cnn, RNN, uwb, искусственный интеллект, радар, радарные датчики, сверхширокополосная радиолокация, сшп, трансформеры

В данной статье речь пойдёт о том, как используя разные архитектуры нейронных сетей классифицировать данные полученные со сверхширокополосного радара " XETHRU by NOVELDA X4M02 290056-010 ". Моя работа основана на публикации " UWB-gestures, a public dataset of dynamic hand gestures acquired using impulse radar sensorsЧитать полностью »

Обзор архитектуры Swin Transformer

2022-01-01 в 20:18, admin, рубрики: attention, CV, swin transformer, машинное обучение, обработка изображений

Трансформеры шагают по планете! В статье вспомним/узнаем как работает visual attention, поймём, что с ним не так, а главное как его поправить, чтобы получить на выходе best paper ICCV21.

CV-трансформеры in a nutshell

Attention Is All You Need

Начнём издалека, а именно с 2017 года, когда A Vaswani et al. опубликовали знаменитую статью «Attention Is All You Need»Читать полностью »

Attention для чайников и реализация в Keras

2019-07-06 в 9:28, admin, рубрики: attention, deep learning, keras, machine learning, neural networks, python, wunderfund, машинное обучение

О статьях по искусственному интеллекту на русском языке

Не смотря на то что механизм Attention описан в англоязычной литературе, в русскоязычном секторе достойного описание данной технологии я до сих пор не встречал. На нашем языке есть много статей по Искусственному Интеллекту (ИИ). Тем не менее, те статьи, которые удалось найти, раскрывают только самые простые модели ИИ, например, свёрточные сети, генеративные сети. Однако, по передовым новейшим разработками в области ИИ статей в русскоязычном секторе крайне мало.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «attention»

Вы соревнуетесь не с умными людьми, а с их вниманием, и планка сейчас на дне

Проблемы людей и нейросетей

Куда и почему уходят бабки на нейросети

Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

Как сделать нейросети понятнее: эксперимент OpenAI с разреженными моделями

Momentum Attention: когда внимание получает инерцию

Нейросетевой подход для классификации событий отслеживаемых сверхширокополосным радаром

Обзор архитектуры Swin Transformer

CV-трансформеры in a nutshell

Attention Is All You Need

Attention для чайников и реализация в Keras

О статьях по искусственному интеллекту на русском языке