Рубрика «машинное обучение» - 3

Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

2025-12-17 в 15:05, admin, рубрики: attention, llms, natural language processing, nlp, Transformers, глубокое обучение, машинное обучение, механизм внимания, трансформеры

Знание механизма внимания и трансформеров - база любых собеседований на все грейды в NLP!

Статья не рассчитана на изучение тем с нуля, если вы еще не слышали ничего про attention, то лучше обратиться к полноценным лекциям.

Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по NLP, чтобы закрыть пробелы и вспомнить необходимую базу.

Содержание:

Архитектура трансформера
Механизм внимания
Позиционные эмбеддинги
Токенизация
Трансформерные архитектуры (BERT, GPT и тд)
Полезные материалы

Читать полностью »

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

2025-12-16 в 18:37, admin, рубрики: attention, FlashAttention, llm, Transformers, triton, большие языковые модели, внимание, машинное обучение, оптимизация производительности, трансформеры

Читать полностью »

Карта для капитана. Как я рабочее место руководителя для 1С:ERP создавал

2025-12-13 в 8:16, admin, рубрики: 1c, AI, bpmn, ERP, ии помощник, интерфейс, машинное обучение, нотации, планирование, управление производством

Читать полностью »

ARC-AGI для оценки способностей ИИ и новый релиз ChatGPT 5.2

2025-12-12 в 17:29, admin, рубрики: arc-agi, OpenAI, бенчмарки, бенчмаркинг, генеративный ии, искусственный интеллект, машинное обучение, Новости, тестирование моделей

Вчера вышла новая версия модели ChatGPT 5.2. В очередной раз Сэм Альтман и OpenAI удивляют качеством модели (в последний месяц было так много релизов, что они решили не отставать). В целом, все как обычно — топовые результаты на большинстве бенчмарков.

Но хочу уделить внимание одному очень сложному бенчмарку, на котором пока многие спотыкаются — ARC-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence). Именно здесь ChatGPT 5.2 показал значительный скачок.

На сегодня существует две версии этого теста. Так о чем же он?

ARC-AGI-1

История начинается в 2019 году со статьиЧитать полностью »

Токенизация, как ключ к языковым моделям для низкоресурсных языков

2025-12-04 в 14:24, admin, рубрики: helsinki-nlp, mistral-7b, кабардинский, машинное обучение, морфология, низкоресурные языки

Привет Хабр, меня зовут Эдуард, и я хочу поделиться своими наблюдениями о том, как статистические алгоритмы извлекают грамматику из текстов.

Введение

Создание языковых моделей для низкоресурсных языков — задача, где успех определяется не столько вычислительной мощностью, сколько правильной подготовкой данных. Особенно это критично для морфологически богатых языков, таких как кабардинский, адыгейский, чеченский или дагестанские языки, где одна словоформа может содержать информацию о лице, времени, виде, пространственных отношениях и множестве других грамматических категорий.

Читать полностью »

Автоматизируем машинное обучение с помощью ИИ-агентов

2025-12-03 в 6:15, admin, рубрики: ai-агенты, AutoML, llm, python, машинное обучение

Решая соревнования на Kaggle начинаешь замечать паттерн. Baseline сделать просто: загрузить данные, запустить CatBoost или LightGBM, получить baseline метрику. Это занимает полчаса. Но чтобы попасть в топ решений, нужно перепробовать десятки вариантов препроцессинга, сотни комбинаций фичей и тысячи наборов гиперпараметров.

Читать полностью »

Оптимальный путь в NLP: как стать Middle за полгода

2025-11-23 в 17:09, admin, рубрики: data science, ml system design, nlp, python, rag, машинное обучение, нейронные сети, обучение программированию, трансформеры

Стать Middle NLP Engineer за 6 месяцев — реально.

Не за два года, не через бесконечные курсы — а за полгода нормальной учебы.

Эта статья - про оптимальный путь. Без матана, без академизма, без «прочитай пять книг». Только то, что реально нужно для собеседований и работы.

Почему это реально:

Мой путь от нуля до стажёра занял два года, и сейчас я понимаю, как пройти его быстрее
После нахождения первой работы я вырос до Senior за год;
Я регулярно провожу собеседования и знаю реальные требования;
Уже помог нескольким людям войти в профессию.

Читать полностью »

Как я собрал и подготовил датасет дефектов печатных плат для обучения моделей YOLO

2025-11-20 в 22:47, admin, рубрики: computer vision, dataset, labeling, machine learning, pcb, yolo, машинное обучение, обучение моделей, разметка датасета, учусь программировать

Когда пришло время выбирать тему диплома, я, как и многие студенты, понятия не имел, о чём писать. После мозгового штурма с одногруппниками родилась идея, которая из простого «варианта для защиты» превратилась в полноценный инженерный проект: «исследование и разработка системы автоматического распознавания дефектов печатных плат».

Со временем я понял, что выбрал тему не случайно - это реально актуальная задача для производства, где качество пайки напрямую влияет на работоспособность устройств, а ещё отличный шанс пройти весь цикл Computer Vision проекта от сбора данных до обучения моделей.

Читать полностью »

Томпсоновское семплирование: «расстрел» A-B-тестов и скрытый потенциал ML

2025-11-17 в 12:34, admin, рубрики: Алгоритмы, машинное обучение, многорукие бандиты, семплирование томпсона, ускорение АБ тестов

Всем привет! Меня зовут Саша, работаю ведущим аналитиком в Озон Банке. По мотивам доклада на онлайн-дне МатеМаркетинга'25 было решено написать данную статью, пересказывающую основные идеи доклада о семплировании Томпсона

Решаемая задача

Представьте: вы пришли в казино с кучей игровых автоматов.

Вы хотите найти тот, в котором вероятность выигрыша наибольшая, проверяя автоматы путем игры в них.
Каждая итерация проверки платная - вы хотите крутить "плохие" автоматы как можно меньше

Читать полностью »