Рубрика «claude» - 14

Всем привет! Меня зовут Александр, я COO в SaaS-платформе для аналитики данных. Последний год активно изучаю AI-решения в кросс-функциональные процессы. В своих переводах делюсь материалами, которые помогают:

  • Продуктовым менеджерам — интегрировать AI без перегрузки команд;

  • Разработчикам — выбирать инструменты под конкретные бизнес-задачи;

  • Специалистам по данным — избегать ошибок в production-развертывании.

Сегодняшний перевод Субъективный гид по выбору модели искусственного интеллекта в 2025 годуЧитать полностью »

Поток ваших ежедневных задач превращается в настоящее цунами, ассистенты от такой многозадачности бегут, теряя тапки, а двести электронных писем сами на себя по-прежнему не отвечают? Попробуйте делегировать не человеку, а нейросетям! Разбираем «резюме» популярных кандидатов в нейроасситенты, чтобы найти того самого сотрудника.

Они умеют многое. Они готовы ко всему. Они уже здесь!

Могут ли LLM писать более качественный код, если их об этом просто попросить? - 1


В ноябре 2023 года, когда OpenAI добавила в ChatGPT возможность генерации изображений DALL-E 3 через веб-интерфейс ChatGPT, на короткое время возник мем: пользователи отправляли LLM базовое изображение и несколько раз просили «сделать его более X», где X могло быть чем угодно.

Примеры

Могут ли LLM писать более качественный код, если их об этом просто попросить? - 2

Обычный парень становится всё более «бро».

Могут ли LLM писать более качественный код, если их об этом просто попросить? - 3

Санта становится всё более «серьёзным».

Тренд быстро сошёл на нет, потому что все эти изображения были очень похожими и скучными; к тому же они необъяснимым образом все сводились к чему-то космическому, вне зависимости от исходного изображения и промта. Тем не менее, этот тренд достаточно любопытен с научной точки зрения тем, что столь бессмысленный и нечёткий промт каким-то образом влияет на конечное изображение, и что это изменение очевидно для пользователя.

А что будет, если я попробую похожий способ с кодом? Сгенерированный LLM код вряд ли будет мусорным (хоть это и возможно), поскольку он следует строгим правилам, и в отличие, например, от изображений, его качество можно измерить объективнее.

Если код в самом деле можно улучшить, просто при помощи интерактивного промтинга, попросив LLM «написать код получше» (хоть это и очень глупо), то это приведёт к огромному росту продуктивности. А если это так, то что произойдёт, если таких итераций с кодом будет слишком много? Каким станет эквивалент «космического» кода? Есть только один способ это выяснить!Читать полностью »

Где-то летом 2024 года в некоторых OpenAI сервисах появилась возможность использовать "инструменты".
Инструмент — это функция, которая выполняется на сервере и возвращает некий результат. Например, в ChatGPT можно было использовать инструменты для поиска информации в интернете, для генерации изображений и т.д.

Это был закрытый API, который использовался внутри OpenAI, и как и что там происходило было довольно туманно.

Anthropic (создатель Claude) совершил мини-революцию в AI инструментарии, создав открытый протокол MCP с расширенными возможностями для создания подобных инструментов и даже больше.

Читать полностью »

Мой хобби-проект провалился из-за лжи ИИ - 1

TLDR: ИИ — это не ваш помощник, а разработчик-джун, имитирующий профессионализм. Доверяйте ему на свой страх и риск.

Я уже четыре дня занимаюсь своим хобби-проектом. Я был уверен, что реализую его. У меня был хороший план и большой интерес к проекту. Позвольте мне познакомить вас с DeskthangЧитать полностью »

За прошедший год мы поработали с десятками команд, создающих агентов на основе больших языковых моделей (LLM) в различных отраслях. Последовательно мы отмечали, что самые успешные реализации не использовали сложные фреймворки или специализированные библиотеки. Вместо этого они строились на простых, составных паттернах.

В этой статье мы делимся тем, что узнали, работая с нашими клиентами и создавая агентов самостоятельно, а также даём практические советы разработчикам по созданию эффективных агентов.

Что такое агенты?

Читать полностью »

Буквально несколько часов назад (на момент написания этой статьи), компания Anthropic предоставила свое новое исследование по обходу защитных механизмов LLM в открытый доступ.

Новое совместное исследование: «Лучший способ взлома моделей» (Best-of-N Jailbreaking).

«Мы обнаружили простой и универсальный метод, который позволяет обходить механизмы безопасности передовых AI‑моделей и работает с текстом, изображениями и аудио.»


Основная суть

Читать полностью »

Я 8 часов тестировал модель o1 Pro за 200$ и сравнил ее с Claude Sonnet 3.5 за 20$ - 1

После всей шумихи вокруг выхода o1 Pro я решил провести обширное сравнение. Результаты оказались неожиданными, и я решил поделиться своими выводами с сообществом.

Методология тестирования

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js