Рубрика «языковые модели» - 6

Почему DeepSeek способен конкурировать с OpenAI и как повторить их опыт

2025-01-28 в 8:10, admin, рубрики: AI, chatgpt, deepseek, llama, OpenAI, ИИ, языковая модель, языковые модели

За последние два года - за время невероятной популярности Generative AI - появилось много перспективных компаний, создающих новые прорывные модели. Последний пример - это китайский стартап DeepSeek, благодаря которому у нас есть открытые аналоги OpenAI GPT-4o и o1. С теми же (что проверено бенчмарками) возможностями в плане выполнения текстовых инструкций, задач на математику, логику и кодинг.

Читать полностью »

Сравнение моделей ChatGPT o1 и DeepSeek-R1 на простом шифровании

2025-01-23 в 3:35, admin, рубрики: AI, llm, ИИ, нейросети, языковые модели

Возникла как-то идея проверить, смогут ли языковые модели общаться между собой так, что люди их уже перестанут понимать. Помню, были исследования, когда их просили сжать текст и они сжимали его во что-то совершенно нечитаемое, но потом почти полноценно расшифровывали. Однако, пока остановился на более простом варианте.

Читать полностью »

Обзор уязвимостей для LLM. Часть 1. Атака

2025-01-05 в 13:55, admin, рубрики: bias, gpt-4, refusal training, sota, атаки, дипфейки, подмена номера, промпт-инъекции, промпты, языковые модели

Большие языковые модели где только не применяют: генерируют внешний вид автомобилей, домов и кораблей, саммаризируют круглые столы и конференции, придумывают тезисы к статьям, рассылкам и презентациям. Но при всех «плюшках» от внедрения ИИ, не стоит забывать про безопасность. Большие языковые модели атакуют разнообразными изощрёнными способами. В топе новостей о нейросетях — многомиллионные инвестиции в средства защиты от промпт-инъекций. Поэтому поговорим о том, какие угрозы существуют и почему инвесторы платят большие деньги за создание таких бизнесов. А во второй части статьи расскажу, как от них защищаться.

Читать полностью »

Будущее LLM в XS, S, M и других размерах

2024-12-28 в 12:53, admin, рубрики: llm, искусственный интеллект, языковые модели

Читать полностью »

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM

2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели

RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.

Читать полностью »

T-Lite и T-Pro – открытые русскоязычные опенсорс-модели на 7 и на 32 млрд параметров

2024-12-11 в 7:48, admin, рубрики: machine learning, модели, языковые модели

Всем привет! Я Толя Потапов, MLE в Т-Банке. Руковожу командой разработки фундаментальных моделей.

Читать полностью »

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

2024-12-08 в 6:27, admin, рубрики: llm, nlp, rag, база знаний, Большие данные, большие данные и машинное обучение, машинное обучение, разработка, языковые модели

Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем.

Читать полностью »

Псст, ИИ нужен? 5 полезных инструментов для разработчика

2024-11-29 в 12:48, admin, рубрики: llm, искусственный интеллект, машинное обучение, разработка, языковые модели

Читать полностью »

Человек и LLM: как построить метрики для оценки моделей

2024-11-28 в 7:02, admin, рубрики: llm, ml, ml-метрики, бенчмарки, машинное обучение, метрики, нейросети, оценка качества, языковые модели

Привет, меня зовут Ирина Барская, и я руководитель службы аналитики и исследований в Яндексе. А это значит, что я и моя команда каждый день думаем, как оценивать качество работы генеративных моделей, какие при этом смотреть метрики, как вообще понять, хорошая ли модель у нас получилась.

Читать полностью »

Как мы создали LLM-модель Cotype Nano

2024-11-26 в 8:24, admin, рубрики: llm, nlp, opensource, ИИ, искусственный интеллект, нейрон, нейросеть, обработка естественного языка, открытый код, языковые модели

На связи группа фундаментальных исследований MTS AI. В этой статье мы расскажем про дроп трех маленьких моделей Cotype-Nano, Cotype-Nano-4bit и Cotype-Nano-CPU. Расскажем, как нам удалось достичь 1 места на RuGeneralArena в своей весовой категории.

Как мы создали LLM-модель Cotype Nano - 1

Почему мы решили создать маленькие LLM

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «языковые модели» - 6

Почему DeepSeek способен конкурировать с OpenAI и как повторить их опыт

Сравнение моделей ChatGPT o1 и DeepSeek-R1 на простом шифровании

Обзор уязвимостей для LLM. Часть 1. Атака

Будущее LLM в XS, S, M и других размерах

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM

T-Lite и T-Pro – открытые русскоязычные опенсорс-модели на 7 и на 32 млрд параметров

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

Читать полностью »

Псст, ИИ нужен? 5 полезных инструментов для разработчика

Человек и LLM: как построить метрики для оценки моделей

Как мы создали LLM-модель Cotype Nano

Почему мы решили создать маленькие LLM