Рубрика «DL»

Инференс нейросетевых моделей для табличных данных с помощью ONNX Runtime на C++

2026-02-01 в 7:36, admin, рубрики: c++, DL, ONNX, onnxruntime, ORT, TabularDL, инференс моделей

Развертывание нейросетевых моделей в production-среде — критически важный этап ML-пайплайна. Когда речь заходит о встраивании в C++ приложения (будь то высоконагруженные сервисы, desktop-софт или встраиваемые системы), выбор инструментария сужается. Прямое использование фреймворков вроде PyTorch или TensorFlow часто избыточно и приводит к зависимостям, сложностям сборки и излишнему потреблению памяти.

ONNX Runtime (ORT)Читать полностью »

Объяснимый ИИ в ML и DL

2025-05-29 в 3:33, admin, рубрики: DL, explainable ai, ml, python, shap

Объяснимый ИИ — очень важный аспект в ML и DL. Он заключается в том, чтобы интерпретировать модель так, чтобы можно было около прозрачно объяснить ее решения. Потому что это довольно частая необходимость как у конечного заказчика, ведь для них это просто «черный ящик», так и у разработчиков непосредственно (например, для отладки модели). На русском языке таких статей не так много (для тех, кто знает английский проблем с этим нет, на нем таких статей много, например, Kaggle), поэтому я решил, что статья покажется актуальной, и сегодня я попробую рассказать про это и показать на конкретном примере, как его можно реализовать.

Читать полностью »

Есть ли у AMD перспективы в AI-ML-DL. Часть 1

2025-05-15 в 12:11, admin, рубрики: AI, amd, DL, ml, Nvidia, selectel, машинное обучение

Привет! Я Ефим Головин, старший MLOps-инженер в Selectel. Некоторое время назад мы в отделе Data/ML начали задаваться вопросом: а как там поживает AMD? Понятно, что у них масса дел, но нас интересовало, скорее, что у них в плане AI/DL/ML. С NVIDIA все плюс-минус ясно, это стандарт. А вот AMD — что-то неизвестное. Я вообще предполагал, что у «красных» хотя бы в плане терминологии и документации все должно быть плюс-минус аналогично тому, как оно есть у NVIDIA. Но решил убедиться в этом, поэтому отправился изучать документацию обеих компаний и попал в дивный мир хаоса, бардака и разброса в терминах. Не могу держать в себе, давайте разбираться вместе. Начнем, как ни странно, с поиска истины в документации NVIDIA.Читать полностью »

Обзор техник RAG: Retrieval Augmented Generation

2025-04-24 в 11:15, admin, рубрики: deeplearning, DL, large language model, llm, machinelearning, ml, natural language processing, nlp, rag, retrieval augmented generation

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.

Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.

Все полезные ссылки и материалы, на которые я опирался будут в конце.

Что такое RAG и зачем нужен

RAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

Читать полностью »

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

2025-04-09 в 12:00, admin, рубрики: deep learning, DL, ml, selectel, глубокое обучение, ИИ, искусственный интеллект, машинное обучение, познавательное

Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в ~~руку~~ пальцы Ctrl/Cmd+F и начинаем раскопки!Читать полностью »

Алгоритмы спекулятивного инференса LLM

2025-01-05 в 9:25, admin, рубрики: DL, DL инференс, llm, ml, ML алгоритмы, алгоритмическая оптимизация, инференс, оптимизация инференса, спекулятивный декодинг

Введение

За последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности.
Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.

Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим “на автомате”. В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.

Читать полностью »

Открытый курс «Deep Learning in NLP» от создателей DeepPavlov на базе курса cs224n

2020-02-06 в 11:00, admin, рубрики: course, deep learning, deeppavlov, DL, machine learning, natural language processing, nlp, ods, ods.ai, open data science, python, Блог компании Open Data Science, искусственный интеллект, машинное обучение

Всем привет!

Вступление

Меня зовут Алексей Клоков, я хочу рассказать о запуске классного курса по обработке естественного языка (Natural Language Processing), который очередной раз запускают физтехи из проекта DeepPavlov – открытой библиотеки для разговорного искусственного интеллекта, которую разрабатывают в лаборатории нейронных систем и глубокого обучения МФТИ. Благодарю их и Moryshka за разрешение осветить эту тему на Хабре в нашем ods-блоге. Итак, поехали!

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «DL»

Инференс нейросетевых моделей для табличных данных с помощью ONNX Runtime на C++

Объяснимый ИИ в ML и DL

Есть ли у AMD перспективы в AI-ML-DL. Часть 1

Обзор техник RAG: Retrieval Augmented Generation

Что такое RAG и зачем нужен

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Алгоритмы спекулятивного инференса LLM

Введение

Читать полностью »

Открытый курс «Deep Learning in NLP» от создателей DeepPavlov на базе курса cs224n