Рубрика «llm» - 2

Всем привет! На Хабре регулярно появляются посты, так или иначе затрагивающие область права: от мировых антимонопольных споров до инициатив отечественных регуляторов. Но за громкими кейсами остается незамеченной другая интересная область — работа обычных юридических департаментов. В этой статье мы будем этот пробел восполнять: поделимся тем, как с помощью LLM анализировать поток из сотен договоров в ракурсе рисков и экономить на этом в год сотни часов работы юристов.

Читать полностью »

Быстрое развитие и внедрение мощных генеративных моделей искусственного интеллекта сопровождается экологическими последствиями, включая увеличение спроса на электроэнергию и потребления воды.

Адам Зеве | MIT News

17 января 2025 г.

Читать полностью »

Небольшая история о том, как мы искали чат-бота на рынке, но не нашли и построили гибридную систему (правила + ИИ), которая обходится в ~5 000 руб. в месяц.


Какой подход подойдет вам?

Краткий итог нашего изучения рынка и создания собственного бота (почему это так - читайте ниже):

Промпт-бот (500 ₽ фриланс + 50 000 ₽/месяц API):
Читать полностью »

От микроменеджмента до автопилота: 4 стадии рефакторинга AI-кода на примере десктопного приложения - 1

Реддит и ХабрЧитать полностью »

У меня небольшая продуктовая команда, 12 человек, пилим B2B-логистику. Go, React, PostgreSQL, всё на кубере. Предметка скучная снаружи, но внутри — ад: у каждого перевозчика свой API, и каждый API как будто писали в пятницу вечером. У СДЭК поле tariff_code в одном эндпоинте строка, а в другом число, я до сих пор не понимаю почему, и никто там не понимает, я спрашивал.

Читать полностью »

У многих из нас есть «кладбище» аудиозаписей: интервью, лекции, длинные совещания. Когда мой архив перевалил за сотню часов, я понял, что пора что-то менять. Облачные сервисы либо кусаются по цене, либо выдают «кашу» без нормальной пунктуации и разделения спикеров.

В этой статье я расскажу, как собрал локальный конвейер на базе WhisperX, почему 40 ГБ оперативной памяти важнее мощной видеокарты и как метод «вайб-кодинга» помог мне превратить одиночный скрипт в модульное приложение с пакетной обработкой.

Почему не ванильный Whisper?

Оригинальный Whisper от OpenAI хорош, но для моих задач у него было три фатальных недостатка:

  1. Читать полностью »

Skeleton Indexing (KDD 2025) + HippoRAG 2 (ICML 2025) + VectorCypher + Datalog Reasoning + 10 итераций оптимизации


TL;DR

Я реализовал Graph RAG систему, которая комбинирует 5 техник из свежих научных статей в единый пайплайн с декларативным reasoning-движком, полной провенансной трассировкой и типизированным API. Результат: 174/180 (96.7%) на билингвальном бенчмарке из 30 вопросов, оценённых в 6 режимах retrieval. Три режима достигли 100%. Ноль persistent failures.

GitHub: Читать полностью »

Личный опыт, 14 версий и эволюция от «просто не ври» до адаптивного Deep Compute Engine

Вступление: Всё началось с боли

Делал свой проект с помощью нейросети. Всё шло хорошо, пока не начались они. Галлюцинации.

Сначала это было смешно: «Сэр, функция asyncio.gather() принимает 5 аргументов» (принимает *coros). Потом перестало: код не работает, время уходит, итерация за итерацией я объясняю агенту, что он только что выдумал параметр.

В какой-то момент я понял: проблема не в модели. Проблема в том, как я с ней разговариваю.

Так родилась INSTRUCTION_GENTLEMANЧитать полностью »

Как нам перегрузили производство из-за нейронки - 1

Дано: пользователи не знают, что делать с нейросетями. Это известная проблема. Если им не дать прикладной интерфейс, они не понимают, что можно почти всё.

Читать полностью »

Меня давно интересовала тема emergent behavior в мультиагентных системах. Все пишут про AI-агентов, которые пишут код или отвечают на письма. Я хотел другое: что будет, если дать агентам абстрактную цель и ограниченные ресурсы? Будут ли они сотрудничать? Конкурировать?

Гипотеза была скромная: агенты научатся как-то распределять задачи.

Реальность оказалась… ну, другой.

Сетап

Железо: VPS на Hetzner, 8 vCPU AMD EPYC, 32GB RAM, Ubuntu 22.04. Без GPU — агенты только дёргают API, считать нечего. Redis 7.2.3 для message board. Python 3.11.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js