Рубрика «Ollama» - 2

RAG на практике: как мы на базе ИИ-ассистента собрали бота для поддержки в Rocket.Chat

2025-10-02 в 11:30, admin, рубрики: json, llm-модели, n8n, Ollama, rag, Rocket.Chat, ии-ассистент, облачные сервисы, поддержка

Привет! На связи команда Рег.облака. Мы давно следим за развитием Retrieval-Augmented Generation (RAG) и хотели проверить, как эта технология работает в живых сценариях.

У нас есть ИИ-ассистент — это образ виртуальной машины с предустановленными Ollama, Open WebUI и набором моделей. Его можно развернуть в пару кликов и сразу работать с LLM в приватном окружении. Но мы решили пойти дальше и проверить, как он справится в прикладной задаче: собрать чат-бота для нашей техподдержки.

Навигация по тексту

Ollama от А до Я: как выбрать модель, настроить и интегрировать

2025-09-30 в 8:15, admin, рубрики: AI, llm, Ollama

Когда мы говорим об использовании больших языковых моделей (LLM), большинство людей сразу вспоминают облачные сервисы. Но далеко не всегда удобно или возможно работать через интернет: где-то мешают ограничения по приватности, где-то скорость соединения, а иногда просто хочется больше контроля над процессом. Именно для таких задач и существует Ollama — инструмент, который позволяет запускать современные языковые модели локально, буквально в пару действий.

Читать полностью »

Собственный ИИ локально, бесплатно и без GPU

2025-09-24 в 13:18, admin, рубрики: Ollama, ИИ

Сегодня каждый может обзавестись своим собственным ИИ. И даже не потребуется супер-пупер компьютера и дата-центра с кучей GPU. При этом он будет работать без Интернета. Давайте, приступим к тому, чтобы обзавестись на компьютере милым и пушистым питомцем.

Ollama

Для начала нужно установить ollama. Переходим на страницу ollama.com/download и скачиваем дистрибутив для своей операционной системы.

Читать полностью »

Go, Telegram, AI: Создаем систему ранжирования трейдинг-каналов по точности прогнозов

2025-09-21 в 6:30, admin, рубрики: Go, Ollama, postgresql, telegram api, trading

Листая телеграм-каналы с торговыми сигналами, я часто задавался вопросом: а кто из этих экспертов действительно попадает в цель? Одни обещают золотые горы, другие скромно молчат о своих неудачах. Решил разобраться раз и навсегда — создать систему, которая автоматически проверит, кто из гуру трейдинга говорит дело, а кто просто красиво упаковывает воздух.

Архитектура системы

Система состоит из четырех компонентов:

TG-Reader — собирает сообщения из телеграм-каналов через MTProto API
Trade-Radar — извлекает торговые прогнозы из текста с помощью AI
AnalyzerЧитать полностью »

Локальные LLM модели: обзор и тестирование

2025-09-14 в 21:39, admin, рубрики: deepseek, gemma, llm, Ollama, qwen, генерация кода, искусственный интеллект, локальные модели, машинное обучение, нейросети

В ★5УГЛОВ мы часто работаем с языковыми моделями — как облачными, так и локальными. И если про онлайн-сервисы знают все, то локальные LLM до сих пор остаются недооцененным инструментом. Я решил поделиться личным опытом: какие модели можно запускать прямо на ПК, чем они полезны и зачем их вообще использовать в реальных проектах.

Читать полностью »

Autumn vibes. Как я с кодингом с помощью LLM знакомился

2025-09-10 в 20:10, admin, рубрики: idea, llm-модели, Ollama, локальный запуск нейросетей

👋 Привет!

Сегодня хочу поделиться своим опытом работы с локальными LLM (Large Language Models). Это что-то вроде GitHub Copilot, только без подписки, оффлайн и с контролем над своими данными.

Зачем вообще связываться с локальными LLM?

У многих часто одни и те же страхи:

«Это слишком сложно».
«Оно съест всю оперативку».
«А вдруг мой код утечёт в облако».
«Да оно будет писать чушь».

На деле, уже сегодня можно запустить модель в 7B параметров на обычном MacBook или ноутбуке с 16 GB RAM.

И получить вполне рабочего помощника для кода, тестов и рефакторинга.

Читать полностью »

Разворачиваем локально ИИ при помощи клиента Microsoft.Extensions.AI и Ollama

2025-08-24 в 16:48, admin, рубрики: AI, Ollama, ИИ, локальный ИИ на Net

Читать полностью »

Темные лошадки ИИ – инференс LLM на майнинговых видеокартах Nvidia CMP 50HX, CMP 90HX

2025-08-24 в 12:11, admin, рубрики: 50HX, 90HX, CMP, fp16, llm, LM Studio, Nvidia, Ollama, искусственный интеллект, майнинг

Синтетические тесты показывают, что эти карты в 10 раз медленнее старых игровых. Но на практике с LLM они оказались на уровне RTX 2060/3060. Эта статья для тех, кто хочет сделать дешёвый LLM-сервер и любителей хардкорных экспериментов.

По ходу мы рассмотрим:

теоретические данные
условия для работы этих GPU
результаты практических тестов производительности
объяснение полученных противоречий
советы по небольшим доработкам (охлаждение, PCIexpress)
сравнение друг с другом и другими GPU

Введение

Читать полностью »

GPT-OSS-20B – 120B: Сухие цифры после реальных тестов

2025-08-20 в 9:16, admin, рубрики: GPT-OSS-120B, GPT-OSS-20B, H100 PCIe, llm, Ollama, RTX 4090 vs RTX 5090, TPS токены в секунду, vllm, VRAM использование, локальная LLM

OpenAI выпустила GPT-OSS модели (https://huggingface.co/openai/gpt-oss-20b и https://huggingface.co/openai/gpt-oss-120b) , и сообщество немедленно начало экспериментировать. Но реальные бенчмарки производительности найти сложно. В этой статье представлены результаты нашего практического тестирования на арендованном железе через RunPod с использованием Ollama.

Ремарка: Тесты проводились на Ollama для быстрого деплоя. Если будете использовать vLLM, то производительность будет примерно +30%, но он слабо адаптирован под консьюмерские GPU, за исключением RTX 5090.

Что тестировалось:Читать полностью »

Вайб-кодинг с доставкой на дом

2025-08-19 в 10:05, admin, рубрики: kubernetes, llama.cpp, Ollama, вайб-кодинг

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «Ollama» - 2

RAG на практике: как мы на базе ИИ-ассистента собрали бота для поддержки в Rocket.Chat

Навигация по тексту

Ollama от А до Я: как выбрать модель, настроить и интегрировать

Собственный ИИ локально, бесплатно и без GPU

Ollama

Go, Telegram, AI: Создаем систему ранжирования трейдинг-каналов по точности прогнозов

Архитектура системы

Локальные LLM модели: обзор и тестирование

Autumn vibes. Как я с кодингом с помощью LLM знакомился

Зачем вообще связываться с локальными LLM?

Читать полностью »

Разворачиваем локально ИИ при помощи клиента Microsoft.Extensions.AI и Ollama

Темные лошадки ИИ – инференс LLM на майнинговых видеокартах Nvidia CMP 50HX, CMP 90HX

GPT-OSS-20B – 120B: Сухие цифры после реальных тестов

Вайб-кодинг с доставкой на дом