Рубрика «Transformers»

Сравнил тоже! Нашел на Python разницу между «Бородино» и «Ледовым побоищем»

2025-12-22 в 18:54, admin, рубрики: huggingface, nlp, NLTK, python, scikit-learn, torch, Transformers, литература, нейросети, поэзия

"Бородино" Лермонтова и "Ледовое побоище" Симонова две классические военно-патриотические поэмы, были созданы по мотивам крупных военных событий, но по-разному описывают ратный подвиг русского воина. Мне стало интересно сравнить два произведения объективно, использовать для анализа предобученные эмбеддинги и визуализировать результат.

Для работы я использовал библиотеку transformers для загрузки и применения предобученной модели LaBSE. Библиотека torch понадобилась мне для работы с нейросетевой моделью. scikit-learn я использовал для снижения размерности с помощью PCA и t-SNE.

Читать полностью »

Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

2025-12-17 в 15:05, admin, рубрики: attention, llms, natural language processing, nlp, Transformers, глубокое обучение, машинное обучение, механизм внимания, трансформеры

Знание механизма внимания и трансформеров - база любых собеседований на все грейды в NLP!

Статья не рассчитана на изучение тем с нуля, если вы еще не слышали ничего про attention, то лучше обратиться к полноценным лекциям.

Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по NLP, чтобы закрыть пробелы и вспомнить необходимую базу.

Содержание:

Архитектура трансформера
Механизм внимания
Позиционные эмбеддинги
Токенизация
Трансформерные архитектуры (BERT, GPT и тд)
Полезные материалы

Читать полностью »

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

2025-12-16 в 18:37, admin, рубрики: attention, FlashAttention, llm, Transformers, triton, большие языковые модели, внимание, машинное обучение, оптимизация производительности, трансформеры

Читать полностью »

Momentum Attention: когда внимание получает инерцию

2025-10-27 в 15:58, admin, рубрики: AI, attention, deep learning, machine learning, pytorch, research, Transformers, нейросети

В классическом self-attention каждый токен смотрит на другие токены, чтобы понять, что важно в данный момент.
Внимание распределяется мгновенно:

Momentum Attention: когда внимание получает инерцию - 1

Именно этот механизм сделал трансформеры тем, чем они стали.

Но вот в чём проблема - внимание не имеет памяти.
Читать полностью »

Парсим и определяем тональность сообщений в Telegram

2025-10-25 в 17:56, admin, рубрики: python, telegram, telegram api, Transformers

Для работы использую Google Colaboratory.

Шаг 1. Получение API ID и Hash.

До начала работы с API Telegram необходимо получить собственный API ID и Hash. Это можно сделать пройдя по ссылке https://my.telegram.org/auth?to=apps, указав номер телефона привязанный к профилю, и заполнив App title и Short name. Platform - можно выбрать “Other (specify in description)”. Остальные параметры можно оставить пустыми.

После того как все шаги выполнены вы получите собственные API ID и Hash.

Важно: В Telegram в настройках конфиденциальности должна быть отключена двухэтапная аутентификация.

Шаг 2. Вход в аккаунт Telegram.

Читать полностью »

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

2025-10-17 в 15:25, admin, рубрики: AI, llm, Transformers, автопромптинг, ИИ, промпт-инжиниринг, промпты-подсказки

Читать полностью »

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

2025-09-16 в 10:40, admin, рубрики: copilot, llm, nlp, Transformers, искуственный интеллект, кодовый ассистент

Читать полностью »

Как устроены нейросети для неспециалистов

2025-08-28 в 8:05, admin, рубрики: gpt, llm, llm-модели, timeweb_статьи, Transformers, как работает, нейросети, объяснение для новичков, объяснение сложного через простое, языковые модели

Нам часто предлагают врубиться во что-то с места в карьер: «Вот я формулку нарисовал и всем понятно!».

Читать полностью »

Semantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор

2025-08-18 в 15:38, admin, рубрики: data science, machine learning, recsys, Transformers

👋 Привет!

Меня зовут Никита Горячев, я Research Engineer в WB, последние несколько лет работаю на стыке RecSys, LLM и мультимодальных моделей. Каждый день мы обрабатываем миллиарды событий, а модели, которые мы внедряем, напрямую влияют на CTR, удержание и конверсию, принося немало дополнительной выручки.

До этого я успел поработать в AI-стартапе в Palo Alto, где занимался голосовыми агентами (ASR/TTS), и в МТС, где мы строили AI-экосистему. Ранее в Сбере я занимался созданием единого RecSys SDK для всей экосистемы (от SberMegaMarket до Okko и Zvuk), а ещё раньше — развивал персонализацию и ML в ритейле.

Читать полностью »

Нейросети простым языком

2025-08-12 в 5:15, admin, рубрики: AI, chatgpt, gemini, grok, llama.cpp, llm, Transformers

Привет!

В интернете можно найти разные объяснения того, как работают нейросети, но те, что мне попадались, были либо слишком специфичны и ориентированы на специалистов, либо слишком упрощены.

Постарался написать свои объяснения, которые были бы не было слишком упрощены, но при этом по возможности понятны.

Статья на 10 процентов скомпилирована из других статей, на 30 процентов скомпилирована из множества диалогов с разными LLM и на 60 процентов “написана от руки” на основании статей и ответов.

Оглавление

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «Transformers»

Сравнил тоже! Нашел на Python разницу между «Бородино» и «Ледовым побоищем»

Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

Momentum Attention: когда внимание получает инерцию

Парсим и определяем тональность сообщений в Telegram

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

Как устроены нейросети для неспециалистов

Semantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор

Нейросети простым языком