Рубрика «нейросети» - 22

Как устроены нейросети для неспециалистов - 1

Нам часто предлагают врубиться во что-то с места в карьер: «Вот я формулку нарисовал и всем понятно!».

Читать полностью »

Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena

Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно больше нравится.

TL/DR: 

  • Мы можем за 3 дня воспроизвести пользовательский рейтинг LLM с точностью 90%+;

  • Читать полностью »

С выпуском нового поколения чипов Blackwell для рынка потребительских видеокарт ожидаемо было увидеть версии GPU и для рабочих станций, которые должны были прийти на замену A5000/A6000-серии и быть дешевле, чем GPU уровня A100/H100.

Это и произошло, но при этом Nvidia всех окончательно запутала, выпустив за полгода аж три версии видеокарты RTX PRO 6000 Blackwell. Мы в HOSTKEY к гонке производительности подключились с выходом последней версии, а именно RTX PRO 6000 Blackwell Server Edition, протестировали ее, и нам есть что вам рассказать по итогу (и показать).

Попробуйте сервер с NVIDIA RTX 6000 PRO 96 ГБ - бесплатно!

Читать полностью »

Привет! Сегодня покажем, как буквально за пару вечеров собрать систему, которая расшифровывает звонки, анализирует речь операторов и присылает руководителю отчёт в Telegram.

Например, в кол-центре с 15 операторами такая сводка поможет руководителю быстро понять, кто перегружен, где чаще звучит негатив, а кто просто слишком много говорит. Не надо слушать записи — отчёт сам всё рассказывает.

📊 Отчёт за 19 июля
🎧 Оператор дня: Иван Иванов (emotionScore: 0.42)
🥵 Больше всего негатива: Юлия Тестова (33%)
🗣️ Средняя скорость речи: 132 слов/мин
🤯 Самый «говорящий»: Андрей Максимов (74% времени)
Читать полностью »

В первой части этой статьи я создал аналог игры «Pong!» с помощью нейросети Qwen, которую сегодня некоторые обзорщики называют одной из лучших нейронок для разработки. Во второй части мы с Qwen создали небольшой платформер. Не без проблем, но в целом справились. А вот для третьей части статьи я приготовил особое задание, которое кажется невыполнимым – создать клона «Героев Меча и магии 3», который бы отражал основные механики оригинальной игры. В конце статьи я добавлю ссылку на то, что у меня получилось, чтобы вы смогли сами оценить результат.

Читать полностью »

Попробовал все актуальные на сегодняшний день сети и провёл их бенчмарк на приближенным к реалиям задачах.

Рассмотрены сети:

  • GPT-5 hight

  • Gemini 2.5 Pro

  • Claude 4.1 Opus

  • Grok 4

  • Qwen3 - coder

  • Deepseek-R1

  • GLM-4.5

  • Kimmi-K2

  • GPT-OSS 120b

Для тех кто не хочет читать дальше краткие выводы:

1) с MCP серверами и правильными Rules качество кода вырастает в разы. А что было бы если бы ещё правильные PRD были написаны...

2) Лучшая нейросеть для вайбкодинга в 1С - Claude 4.1 OPUS. Но отрыв от Gemini 2.5 Pro незначительный. При прочих равных Читать полностью »

Нейро-дайджест: ключевые события мира AI за 3 неделю августа 2025 - 1

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут ВандерЧитать полностью »

Когда‑то я посмотрел очень полезное видео про ML, где для аналогии нейронной сети приводилось понятие архиватора. Помню меня это впечатлило и определённо расширило кругозор. Странно, почему тогда я сразу не перенёс это на людей — скорее всего потому, что принято брать мозг за эталон и с него примерять разные наряды на искусственные нейронные сети, а не наоборот.

Читать полностью »

← Предыдущая глава | 

Какие существуют подходы к обучению на нескольких GPU и в чем их сильные и слабые стороны?

Подходы к обучению на нескольких GPU можно разделить на две группы: разделение данных для параллельной обработки несколькими GPU и разделение модели по нескольким GPU для преодоления ограничений памяти, когда размер модели превышает возможности одной видеокарты. Параллелизм данных попадает в первую категорию, в то время как тензорный параллелизм и параллелизм моделей попадают во вторую. Такие подходы как Читать полностью »

Привет, я Маша, дизайнер в креативной студии Клайбер. В своей работе я часто использую нейросети и стараюсь следить за всеми новостями и тенденциями. Однако в последнее время я заметила, что использование AI в дизайне стало повсеместным и многим уже приелось.

Помните, как год-два назад мы удивлялись нейросетям? А сегодня использование ИИ уже всем надоело и почти стало антитрендом. 

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js