Рубрика «AI» - 18

24 ноября 2025 года Anthropic выстрелила релизом Claude Opus 4.5 — модели, которая переписывает правила игры для всех, кто использует LLM в production. Главная фишка? Цена упала в 3 раза, а качество выросло. Звучит как маркетинг, но цифры говорят сами за себя.

Разбираем, что реально изменилось, смотрим независимые бенчмарки и прикидываем, сколько это сэкономит вашей команде.

TL;DR для тех, кто спешит
💰 Цена: $5/1M input tokens (было $15) — снижение в 3 раза

⚡ Скорость: задачи, на которые уходило 2 часа, решаются за 30 минут

🎯 Качество: 80.9% на SWE-bench (лучше GPT-4 и Gemini)

🛡️ Безопасность: в 4.6 раза устойчивее к prompt injection, чем GPT-5.1

Читать полностью »

Если вы устали от вау-демо и хотите строить по-настоящему, заведите Perplexity Space, опишите свои правила, разделите проект на фракталы, посмотрите как модель ведёт себя когда у неё впервые в жизни появляется фундамент.

Современная AI-разработка — это гнев разработчиков, возведённый в систему.

Честно говоря, я задолбался. Нам уже который год рассказывают одну и ту же сказку: «ИИ освободит разработчиков от рутины», «достаточно правильно написать промпт», «будущее за AI-кодингом». А на практике что? Сидишь, жмёшь «сгенерировать ещё раз», смотришь на сгоревшие токены и понимаешь: опять переписывать руками.

Читать полностью »

За последние несколько лет искусственный интеллект стал привычным инструментом для работы с текстом. Вроде бы действительно удобно: придумал идею, накинул пару промптов, получил черновик. Но вместе с этим у моих «коллег» по предпринимательскому цеху растут и сомнения. Сейчас многие переживают, что сгенерированные тексты будут корявыми, глупыми и могут даже помешать продвижению бизнеса в интернете.

Читать полностью »

В 2025 году retention снова стал главной метрикой рынка

Трафик дорожает, конкуренция растет, AI-продукты выходят быстрее, чем я успеваю их тестировать, — и единственный способ выжить в этой гонке: удерживать пользователей, а не просто радоваться скачкам трафика по праздникам.

Но есть проблема: большинство команд все еще думают, что retention — это «график, на который мы будем смотреть, пока CFO грустит».

если вы тоже сейчас грустите, глядя на свой retention, — вы не один

Давайте разберём, как всё работает в реальности.

1. Почему классический retention устарел

Читать полностью »

Привет, Habr

Сделал забавного бота который стал ещё и довольно полезным поэтому решил им поделиться. Хотелось сделать бота, который:

  • По запросу пойдёт в интернет и найдёт то, что мы обсуждаем прямо сейчас, так как он видит контекст беседы и часто понимает, о чём идёт речь, и в ответе даст ссылки на источники, которые найдёт

  • Понимает контекст беседы и не требует объяснять ему каждую деталь

  • Знает какой сейчас год и точное время и учитывает это при поиске информации и при ответах

  • Имеет характер и помнит, кто и как к нему относится в этом чате

  • Расшифровывает голосовые сразу для всего чатаЧитать полностью »

Всем привет!

Меня зовут Владимир Павлов, я продакт-менеджер. Недавно я проходил кейс-интервью и получил отказ со следующим комментарием: «Правильно выбираешь ключевые метрики, но не хватает измеримости, структуры, прокси‑ и контр‑метрик».

Получив данный фидбек, я решил углубиться в метрики, но не нашел простого инструмента для тренировок их построения и работы с ними. Пришлось создать свой инструмент для этих целей :-)

Оплатив платный доступ к GPT, приступил к Vibe Coding. Весь процесс занял примерно 2 недели, занимаясь по вечерам в будние дни + выходные.

Остановился на следующем объеме функциональности:

  1. Читать полностью »

Мультиагентные системы на базе LLM почти всегда строятся вокруг текстовой коммуникации. Агенты объясняют друг другу планы, уточняют шаги, формируют выводы — всё это через генерацию токенов. Такой подход кажется естественным, но он порождает фундаментальные проблемы: текст генерируется медленно, ошибки формулировок на ранних этапах распространяются вниз по цепочке, а количество токенов растёт лавинообразно.

Исследователи из Принстона, Стенфорда и Иллинойса предлагают другой путь: Читать полностью »

Привет! Сегодня расскажу вам сагу о том, как мы искали дешёвые AI-мощности для своего проекта и чуть не сошли с ума. Спойлер: спас нас Китай, но эта помощь стоила нам седых волос и нескольких лет жизни. Делюсь опытом, чтобы вы прошли этот путь быстрее.

Меня зовут Михаил, я работаю в компании VizoGEN на позиции CTO и вся история ниже - наш путь.

Пролог: Скромные запросы и растущие аппетиты

Всё начиналось невинно. Как и у многих, наш стек AI-инструментов (полный список — военная тайна, сорян, NDA) на этапе гипотез скромно кушал с 3080 TI. Потом пошло-поехало: 4080, а там и до 4090 TI рукой подать.

Читать полностью »

Гайд по базовому окружению для AI без знаний в MLOps - 1

Слышите из каждого утюга про «эй-ай» и хотите разобраться в этом тренде? Или просто собрались попробовать запустить ML- или AI-проект, но вас пугают настройки серверов и облаков?                                                     

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js