За последние два года - за время невероятной популярности Generative AI - появилось много перспективных компаний, создающих новые прорывные модели. Последний пример - это китайский стартап DeepSeek, благодаря которому у нас есть открытые аналоги OpenAI GPT-4o и o1. С теми же (что проверено бенчмарками) возможностями в плане выполнения текстовых инструкций, задач на математику, логику и кодинг.
Рубрика «языковые модели» - 6
Почему DeepSeek способен конкурировать с OpenAI и как повторить их опыт
2025-01-28 в 8:10, admin, рубрики: AI, chatgpt, deepseek, llama, OpenAI, ИИ, языковая модель, языковые моделиСравнение моделей ChatGPT o1 и DeepSeek-R1 на простом шифровании
2025-01-23 в 3:35, admin, рубрики: AI, llm, ИИ, нейросети, языковые модели
Возникла как-то идея проверить, смогут ли языковые модели общаться между собой так, что люди их уже перестанут понимать. Помню, были исследования, когда их просили сжать текст и они сжимали его во что-то совершенно нечитаемое, но потом почти полноценно расшифровывали. Однако, пока остановился на более простом варианте.
Обзор уязвимостей для LLM. Часть 1. Атака
2025-01-05 в 13:55, admin, рубрики: bias, gpt-4, refusal training, sota, атаки, дипфейки, подмена номера, промпт-инъекции, промпты, языковые моделиБольшие языковые модели где только не применяют: генерируют внешний вид автомобилей, домов и кораблей, саммаризируют круглые столы и конференции, придумывают тезисы к статьям, рассылкам и презентациям. Но при всех «плюшках» от внедрения ИИ, не стоит забывать про безопасность. Большие языковые модели атакуют разнообразными изощрёнными способами. В топе новостей о нейросетях — многомиллионные инвестиции в средства защиты от промпт-инъекций. Поэтому поговорим о том, какие угрозы существуют и почему инвесторы платят большие деньги за создание таких бизнесов. А во второй части статьи расскажу, как от них защищаться.
Будущее LLM в XS, S, M и других размерах
2024-12-28 в 12:53, admin, рубрики: llm, искусственный интеллект, языковые моделиКак оценивать ваш RAG-пайплайн и валидировать качество ответов LLM
2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели
RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.
T-Lite и T-Pro – открытые русскоязычные опенсорс-модели на 7 и на 32 млрд параметров
2024-12-11 в 7:48, admin, рубрики: machine learning, модели, языковые модели
Всем привет! Я Толя Потапов, MLE в Т-Банке. Руковожу командой разработки фундаментальных моделей.
Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна
2024-12-08 в 6:27, admin, рубрики: llm, nlp, rag, база знаний, Большие данные, большие данные и машинное обучение, машинное обучение, разработка, языковые модели
Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем.
Читать полностью »
Псст, ИИ нужен? 5 полезных инструментов для разработчика
2024-11-29 в 12:48, admin, рубрики: llm, искусственный интеллект, машинное обучение, разработка, языковые моделиЧеловек и LLM: как построить метрики для оценки моделей
2024-11-28 в 7:02, admin, рубрики: llm, ml, ml-метрики, бенчмарки, машинное обучение, метрики, нейросети, оценка качества, языковые модели
Привет, меня зовут Ирина Барская, и я руководитель службы аналитики и исследований в Яндексе. А это значит, что я и моя команда каждый день думаем, как оценивать качество работы генеративных моделей, какие при этом смотреть метрики, как вообще понять, хорошая ли модель у нас получилась.
Как мы создали LLM-модель Cotype Nano
2024-11-26 в 8:24, admin, рубрики: llm, nlp, opensource, ИИ, искусственный интеллект, нейрон, нейросеть, обработка естественного языка, открытый код, языковые моделиНа связи группа фундаментальных исследований MTS AI. В этой статье мы расскажем про дроп трех маленьких моделей Cotype-Nano, Cotype-Nano-4bit и Cotype-Nano-CPU. Расскажем, как нам удалось достичь 1 места на RuGeneralArena в своей весовой категории.


