Рубрика «Transformers» - 2

Semantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор

2025-08-18 в 15:38, admin, рубрики: data science, machine learning, recsys, Transformers

👋 Привет!

Меня зовут Никита Горячев, я Research Engineer в WB, последние несколько лет работаю на стыке RecSys, LLM и мультимодальных моделей. Каждый день мы обрабатываем миллиарды событий, а модели, которые мы внедряем, напрямую влияют на CTR, удержание и конверсию, принося немало дополнительной выручки.

До этого я успел поработать в AI-стартапе в Palo Alto, где занимался голосовыми агентами (ASR/TTS), и в МТС, где мы строили AI-экосистему. Ранее в Сбере я занимался созданием единого RecSys SDK для всей экосистемы (от SberMegaMarket до Okko и Zvuk), а ещё раньше — развивал персонализацию и ML в ритейле.

Читать полностью »

Нейросети простым языком

2025-08-12 в 5:15, admin, рубрики: AI, chatgpt, gemini, grok, llama.cpp, llm, Transformers

Привет!

В интернете можно найти разные объяснения того, как работают нейросети, но те, что мне попадались, были либо слишком специфичны и ориентированы на специалистов, либо слишком упрощены.

Постарался написать свои объяснения, которые были бы не было слишком упрощены, но при этом по возможности понятны.

Статья на 10 процентов скомпилирована из других статей, на 30 процентов скомпилирована из множества диалогов с разными LLM и на 60 процентов “написана от руки” на основании статей и ответов.

Оглавление

Читать полностью »

Я построил Vision Transformer с нуля — и научил его обращать внимание

2025-07-04 в 13:16, admin, рубрики: computer vision, deep learning, implementation, pytorch, Transformers

Vision Transformer (ViT) — это архитектура, которая буквально произвела революцию в том, как машины «видят» мир.

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

Для начала давайте взглянем на архитектуру Vision Transformer:

Читать полностью »

Как мы научили ИИ читать PDF и экономить сотни рабочих часов: полный кейс создания корпоративного ChatGPT

2025-07-01 в 7:16, admin, рубрики: ai-ассистент, llm, nlp, python, rag, Transformers, бизнес-кейс, поиск, хакатон, Чат-боты

От проблемы до технической реализации — опыт создания ИИ‑ассистента для Росатома за 48 часов хакатона АтомикХак 2.0

Часть 1: Бизнес‑кейс. Зачем это нужно?

Проблема, которая съедает миллионы

Представьте: новый сотрудник крупной корпорации ищет ответ на рабочий вопрос. Он открывает внутренний портал, видит сотни PDF‑инструкций, тысячи записей в базе знаний службы поддержки. Час поиска, звонки коллегам, еще час изучения документов. В итоге — либо неточный ответ, либо решение отложить задачу.

Читать полностью »

Вычисление функции потерь и градиентов в AI переводчике

2025-06-11 в 15:41, admin, рубрики: machinelearning, neural networks, Transformers, ИИ, искусственный интеллект, машинный перевод, переводчик, переводчики, языковые модели

Привет!

Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.

Читать полностью »

Еще один взгляд на LLM: рендеринг под другим соусом?

2025-06-08 в 15:06, admin, рубрики: llm, rendering pipeline, Transformers

Статья написана без использования нейросетей

Любая нейросеть — это black box. Любая LLM — это black box^2. Однако люди смогли их придумать. И если старые нейронные сети, основанные на перцептроне или его производных, базируются на вполне известных биологических процессах, то трансформеры лежат вне представления о работе мозга. Следовательно, возникает вопрос — почему это сделано именно так?

В давнюю для себя пору я работал с трехмерной графикой, и когда мои должностные обязанности привели меня на темную дорожку современного хайпа, увиденное заставило меня задуматься о том, что где‑то все описанное уже было...

Читать полностью »

Соединяем физику и лирику. Как я собрал рекомендательную систему для стихов с помощью Flask, sqlite-vec и Hugging Face

2025-06-07 в 12:11, admin, рубрики: backend, embeddings, flask, llm, nlp, poetry, python, Texts, Transformers, vectors

Люблю я кодить и стихи —
Вот, в общем, все мои грехи...

А. С. Пушкин

Привет! Я Константин Хабазня, преподаватель программирования и математики, а также автор (что бы это ни значило).

N-нное время назад увлёкся NLP (Natural Language Processing), что вполне логично для писателя, который кодит (или кодера, который пишет).

Почитав интернет и пару вводных книжек, отправился учиться на ДПО в МФТИ. В качестве выпускного проекта придумал себе задачу — создать рекомендательную систему для стихов Читать полностью »

Mamba 2 + Transformer = Nemotron H

2025-04-30 в 11:19, admin, рубрики: Hybrid, mamba, Nvidia, Transformers

Содержание

Logit Lens & ViT model: туториал

2025-03-16 в 15:46, admin, рубрики: data analysis, data science, explainable ai, Transformers

Привет!

В этом туториале разобран метод для анализа внутренних представлений "логит-линза" (Logit Lens).

В результате практики по туториалу, вы:

Изучите подход и концепцию Logit Lens;
Реализуете Logit Lens для Visual Transformer;
Познакомитесь с анализом результатов применения логит-линзы.

Приступим! Как всегда, весь код будет на гитхаб — step by step.

Logit Lens: о методе

Метод Logit Lens был предложен на Lessworng в 2020 году на примере модели GPT-2.

Читать полностью »

Исследуем эволюцию архитектур в Computer Vision: Mind Map всех ключевых моделей

2025-03-13 в 16:58, admin, рубрики: computer vision, deep learning, machine learning, mind maps, neural networks, resnet, Transformers, машинное обучение, нейронные сети

Сразу к карте? Если вы предпочитаете действовать, а не читать, вот ссылка на Mind Map . Она доступна для изучения прямо сейчас. А если хотите понять контекст и узнать больше о каждой модели — добро пожаловать под кат!

Введение

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «Transformers» - 2

Semantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор

Нейросети простым языком

Я построил Vision Transformer с нуля — и научил его обращать внимание

Vision Transformer (ViT) — это архитектура, которая буквально произвела революцию в том, как машины «видят» мир.

Как мы научили ИИ читать PDF и экономить сотни рабочих часов: полный кейс создания корпоративного ChatGPT

Часть 1: Бизнес‑кейс. Зачем это нужно?

Проблема, которая съедает миллионы

Вычисление функции потерь и градиентов в AI переводчике

Еще один взгляд на LLM: рендеринг под другим соусом?

Соединяем физику и лирику. Как я собрал рекомендательную систему для стихов с помощью Flask, sqlite-vec и Hugging Face

Mamba 2 + Transformer = Nemotron H

Содержание

Logit Lens & ViT model: туториал

Logit Lens: о методе

Исследуем эволюцию архитектур в Computer Vision: Mind Map всех ключевых моделей

Введение