Рубрика «ml» - 17

Привет! Это моя первая статья на Хабре, так что тапки прошу кидать мягкие (или хотя бы плюшевые).

Поговорим о том, почему сегодня быть full-stack дата-сайентистом — не просто модно, а жизненно необходимо.

Представьте: вы запилили нейросеть, которая определяет котиков на фото с точностью 99.9% (оставшиеся 0.1% — это когда хомяк притворяется котом). Воодушевлённый результатом, бежите к руководству — и тут начинается шоу:

  1. Инфраструктурные проблемы:

    1. Бэкенд-разработчик в отпуске (а его API недоступно)

    2. Фронтенд-интерфейс рисует пиксель-арт вместо функционального дашборда

    3. Читать полностью »

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.

Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.

Все полезные ссылки и материалы, на которые я опирался будут в конце.

Что такое RAG и зачем нужен

RAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

Читать полностью »

В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта.

Кто я и зачем мне это было нужно

Мне 51 год, и я работаю тестировщицей в банке. По образованию я экономист. У меня нет особых навыков программирования. Были попытки учить Python и Java, но без практического применения. По работе немного пишу на JS для авто-тестов в Cypress фреймворке, тестирую UI и API — так что базовое понимание, как всё устроено, у меня есть.

Читать полностью »

API для искусственного интеллекта предоставляют разработчикам доступ к мощным предобученным моделям и при этом не требуют глубоких знаний в области машинного обучения. В статье представлен обзор самых популярных API для работы с искусственным интеллектом. Давайте рассмотрим, как эффективно использовать их в своих проектах.

В статье рассмотрим:

OpenAI API · · Anthropic · · Google Vertex AI · · AWS Bedrock · · Groq · · Cerebras

Зачем использовать API для ИИ?

Используем обработку естественного языка и теорию графов для сравнения и рекомендации различных типов документов.

Введение

Почти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.

Читать полностью »

Привет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.

Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.

Взрыв градиента

Существует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:Читать полностью »

Всем привет! Это Петр Предтеченский — архитектор облачной платформы Cloud.ru Evolution и ведущий трека «Инфраструктура и сервисы» на нашей очередной конференции GoCloud 2025, которая состоялась буквально вчера — 10 апреля. Хочу поделиться с вами краткими итогами мероприятия, а еще рассказать про наши новые облачные и AI-сервисы и то, какой масштаб они могут открыть для решения ваших задач. Погнали! 

Читать полностью »
Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2 - 1

Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в руку пальцы Ctrl/Cmd+F и начинаем раскопки!Читать полностью »

Демо проект с RAG поиском можно посмотреть по ссылке

При разработке ИИ чатов существует два способа интеграции внешних данных: RAG хранилища и Fine tuning. Для не технаря отличия не очевидны, я столкнулся с мнением менеджера проекта, что первое это новая версия второго. Это не так. Поэтому, я сделал short summary, чтобы по существу изложить плюсы и минусы двух решений

Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js