Рубрика «большие языковые модели» - 8

Чему может научить горилла Коко

2024-09-28 в 5:21, admin, рубрики: OpenAI, большие языковые модели, БЯМ, горилла Коко, гориллы, изучение языков, Коко, лингвистика, нейробиология, обезьяны

4 июля 1971 года в зоопарке Сан-Франциско на свет появилась 50-я горилла, которая родилась в неволе. Поскольку дата рождения этой гориллы совпадает с днём независимости США, который отмечается запуском фейерверков, её назвали Ханабико — «дитя фейерверков» по-японски. Мир знает эту удивительную гориллу под именем Коко.

Читать полностью »

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

2024-09-27 в 13:10, admin, рубрики: compresia, compressa ai, llm, lora-адаптеры, selectel, большие языковые модели, квантование, машинное обучение

Привет! Все чаще коллеги из ML замечают, что компаниям нравятся возможности ChatGPT, но далеко не каждая готова передавать данные во внешние АРІ и жертвовать своей безопасностью. В результате команды начинают внедрять open source-LLM, развернутые локально. Чтобы осуществить этот процесс, инженерам нужно выполнить две задачи.

Сделать удобную «песочницу» для экспериментов, чтобы быстро проверять гипотезы для бизнеса.
Эффективно масштабировать найденные кейсы внутри компании, по возможности снижая затраты на ресурсы.

В статье рассказываем, какие есть проблемы у open source-LLM и как оптимизировать инференс модели с помощью квантизации и LoRA-адаптеров. Подробности под катом!

Автор: Алексей Гончаров, основатель платформы Compressa.ai для разработки GenAI-решений на своих серверах.
Читать полностью »

Создание своих тестов для Garak

2024-09-27 в 8:30, admin, рубрики: AI, Garak, llm, llm-attack, Malware, mlsecops, анализ уязвимостей, большие языковые модели, выявление угроз

В прошлой статье я уже говорил о тёмной стороне больших языковых моделей и способах борьбы с проблемами. Но новые уязвимости вскрываются ежедневно, и даже самые крутые инструменты с постоянными обновлениями не всегда за ними успевают. Именно поэтому команда Garak дает пользователям возможность самостоятельного расширения функционала своего инструмента.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security Читать полностью »

Искусственный интеллект — сознание или алгоритм? Проблемы цифровой философии

2024-09-25 в 9:45, admin, рубрики: AI, selectel, большие языковые модели, искусственный интеллект, китайская команда, сознание, цифровая философия

Привет! Проблема сознания у AI волнует философов, нейробиологов, когнитивистов, ML-специалистов и других. Обычно они делятся на два лагеря: одни поддерживают эту гипотезу, а другие — категорически против. Но ни одни, ни другие так и не нашли консенсуса в данном вопросе. В тексте постараемся сузить поток абстрактности вокруг темы и разобраться, почему и как начали изучать сознание у AI.

Автор: Александра Танюшина, преподаватель МГУ, кандидат философских наук, культурный тренд-аналитик и специалист по цифровой философии. Читать полностью »

ИИ от стартапа Mercor провёл интервью с 300 000 соискателей, а теперь его оценивают в 250 миллионов долларов

2024-09-20 в 16:52, admin, рубрики: AI, llm, большие языковые модели, искусственный интеллект, стартап

Под руководством трех 21-летних стипендиатов Thiel Fellows (грант Питера Тиля) ИИ-стартап Mercor привлек $32 млн от Benchmark, Питера Тиля и других инвесторов. Выручка стартапа уже исчисляется десятками миллионов, ежемесячно увеличиваясь на 50%, и он является прибыльным.

Основатели компании Mercor Адарш Хирематх, Брендан Фуди и Сурия Мидха — Читать полностью »

Исследование: генеративный ИИ повышает производительность труда разработчиков на 26,08 %

2024-09-20 в 10:33, admin, рубрики: github copilot, gpt-3.5, gpt-4, microsoft, автодополнение кода, большие языковые модели, БЯМ, исследования, Программирование, статистика

Исследовательская работа утверждает, что использование инструментов с искусственным интеллектом помогает разработчикам выполнять на 26,08 % больше задач.

На тысячах разработчиков из Microsoft, Accenture и некой анонимной компании проводили эксперимент: примерно половине сотрудников выдали доступ к Copilot, а другим пользоваться инструментом не разрешали. Сравнение данных двух групп говорит о положительном эффекте от написания кода с помощью искусственного интеллекта.

Читать полностью »

Сэм Альтман: «ИИ следующего поколения будет способен изобретать прорывные технологии и лечить болезни»

2024-09-19 в 16:13, admin, рубрики: llm, OpenAI, большие языковые модели, ИИ, нейросети, Сэм Альтман, языковые модели

По словам генерального директора компании Сэма Альтмана, следующее поколение систем искусственного интеллекта сможет самостоятельно выполнять задачи без участия человека, и это становится возможным благодаря таким моделям, как новая модель o1 от OpenAI.

Читать полностью »

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

2024-09-17 в 11:56, admin, рубрики: artificial intelligence, natural language processing, большие языковые модели, мультимодальные модели, соревнования, хакатон, Хакатоны

Мы в лаборатории Fusion Brain уже много лет работаем на созданием мультимодальных моделей, способных работать с как можно большим числом данных разного типа. Не так давно, например, мы релизнули мультимодальную LLM OmniFusion 1.1, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, причём с поддержкой русского языка — и рассказали об этом на Хабре.

Читать полностью »

Garak: инструмент Red-Team для поиска уязвимостей в LLM

2024-09-16 в 9:04, admin, рубрики: AI, Garak, llm, llm-attack, Malware, MLSec, mlsecops, анализ уязвимостей, большие языковые модели, выявление угроз

«ChatGPT раскрывает личные данные реальных людей!», «Атака на ChatGPT по сторонним каналам!», «Чат-бот ChatGPT стал причиной утечки секретных данных!», «Хакеры стали использовать ChatGPT в схемах фишинга!». Эти новостные заголовки раскрывают нам тёмную сторону больших языковых моделей. Да, они генерируют за нас контент и анализируют данные, но помимо удобства, приносят новые виды атак и уязвимостей, с которыми надо уметь бороться.

LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM

2024-09-14 в 5:51, admin, рубрики: большие языковые модели, Программирование

Как известно, у больших языковых моделей (LLM) существуют ограничения по размеру контекстного окна. При постановке вопроса часто невозможно вставить весь исходный текст, что требует объединения кода из разных файлов в одном месте.

В связи с этим я разработал скрипт, который минимизирует исходный код проекта путем удаления пробелов, табуляций, комментариев и тестовых функций. Скрипт позволяет собрать все или выбранные файлы проекта в одном месте.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «большие языковые модели» - 8

Чему может научить горилла Коко

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

Создание своих тестов для Garak

Искусственный интеллект — сознание или алгоритм? Проблемы цифровой философии

ИИ от стартапа Mercor провёл интервью с 300 000 соискателей, а теперь его оценивают в 250 миллионов долларов

Исследование: генеративный ИИ повышает производительность труда разработчиков на 26,08 %

Сэм Альтман: «ИИ следующего поколения будет способен изобретать прорывные технологии и лечить болезни»

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

Garak: инструмент Red-Team для поиска уязвимостей в LLM

LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM