Рубрика «большие языковые модели» - 3

Какого китайца выбрать? DeepSeek vs Qwen vs Baidu

2025-08-03 в 19:16, admin, рубрики: Baidu, deepseek, llm, qwen, qwen3, большие языковые модели, искусственный интеллект, искусственный интеллект чат-бот

Я протестировал 3 китайские LLM — теперь боюсь, что GPT в опасности.

Отличительная особенность большинства китайских моделей, что они бесплатные. Сегодня я хочу провести субъективный обзор трёх главных китайских моделей и понять, что лучше использовать и в каких задачах.

⚠️ Это не научная статья, а честный отзыв пользователя

Читать полностью »

Системы ценностей больших языковых моделей

2025-07-31 в 20:09, admin, рубрики: chatgpt, большие языковые модели, БЯМ, исследования, машинное обучение, научные исследования, статистика, ценности, этика, этические ценности

Каждый раз, когда человечество создаёт очередной инструмент на машинном обучении, оно сперва любуется пользой от его работы, а потом пугается своего отражения внутри. С большими языковыми моделями история повторилась с ускорением. От восторга перед ответами ChatGPT до шока от таблиц, где жизнь человека глубоко неравноценна, прошло меньше двух лет.

Звучит странно, но языковые модели предвзяты. У них есть политические взгляды, любимые расы и даже люди, которыми они не прочь пожертвовать. Но обо всём по порядку.

Карьера вайб-кодера — это тупик

2025-07-31 в 7:33, admin, рубрики: large language models, llm-агент, vibecoding, большие языковые модели, вайб-кодинг

Сразу расставлю все точки над «и»: LLM полезны. Вопрос не в том, могут ли LLM писать код, они на это способны. Вопрос в том, почему вайб-кодинг может оказаться вашей худшей карьерной инвестицией.

Читать полностью »

Эволюция архитектур больших языковых моделей: от GPT-2 к современным решениям

2025-07-28 в 11:00, admin, рубрики: AI, deepseek, gemma, gpt, llama, llm, mistral, qwen, большие языковые модели, ИИ

Читать полностью »

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 %

2025-07-12 в 0:21, admin, рубрики: Git, github, Model Evaluation Threat Research, автодополнение кода, большие языковые модели, БЯМ, научные исследования, Программирование, Сursor

Читать полностью »

От промтов к агентам: как мы дошли до трансформеров, что LLM умеют уже сейчас и что нас ждёт в 2027 году

2025-07-11 в 7:45, admin, рубрики: AI-сотрудники, Chatbot Arena, chatgpt, deepseek, llm, LLM-агенты, qwen, reasoning, TAU benchmark, большие языковые модели

Большие языковые модели (LLM) — это то будущее, которое уже случилось. Они генерируют тексты, пишут код и стихи, планируют и даже дают советы, как жить. Их уже используют в образовании, науке и медиа. Наверняка вы хоть раз использовали сервисы вроде GitHub Copilot, чтобы быстрее написать код. Согласитесь, это удобно.

Читать полностью »

Как мы построили свой инструмент для работы с LLM

2025-07-02 в 8:01, admin, рубрики: AI, large language model, llm, llm-модели, большие языковые модели, инструментарий, искусственный интеллект, обработка данных, языковые модели

Привет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и распознавания речи.

В этой статье я бы хотел рассказать про наш инструмент для тренировки языковых моделей, который шесть лет назад родился из простого набора скриптов. Но постепенно усложняяcь, он стал включать в себя функции разметки данных, фильтрации датасетов, генерации данных и тестирования. В какой-то момент инструмент стал настолько функциональный, что я решил сделать ему красивый UI и назвать его - Data Studio.

Итак, что же такое Data Studio ?

Data StudioЧитать полностью »

FActScore-turbo: инструмент для верификации фактов

2025-06-19 в 10:06, admin, рубрики: factscore turbo, llm, большие языковые модели, верификация фактов, фактологичность

Привет! Я Наталья Тяжова, бакалавр ПМИ ФКН, NLP-исследователь. В VK занималась проектом про фактологическую точность LLM. А после выступила на DataFest с докладом, который лёг в основу этой статьи.

Читать полностью »

Как устроены LLM-агенты: архитектура, планирование и инструменты

2025-06-12 в 8:07, admin, рубрики: AI, LangChain, llm, ml, Ollama, selectel, агенты, большие языковые модели, машинное обучение

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!Читать полностью »

Как я нашёл уязвимость в ядре Linux при помощи модели o3

2025-05-27 в 14:15, admin, рубрики: large language models, llm, o3, openai o3, use-after-free, большие языковые модели, уязвимости

В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная настройка, агентские фреймворки и инструменты.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «большие языковые модели» - 3

Какого китайца выбрать? DeepSeek vs Qwen vs Baidu

Системы ценностей больших языковых моделей

Карьера вайб-кодера — это тупик

Эволюция архитектур больших языковых моделей: от GPT-2 к современным решениям

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 %

От промтов к агентам: как мы дошли до трансформеров, что LLM умеют уже сейчас и что нас ждёт в 2027 году

Как мы построили свой инструмент для работы с LLM

FActScore-turbo: инструмент для верификации фактов

Как устроены LLM-агенты: архитектура, планирование и инструменты

Как я нашёл уязвимость в ядре Linux при помощи модели o3