Рубрика «llm» - 104

VLM в Нейро: как мы создавали мультимодальную нейросеть для поиска по картинкам

2024-10-03 в 9:00, admin, рубрики: computer vision, llm, vlm, нейросети, поисковые системы, яндекс

Всем про LLM. Как рассказать про трансформеры одинаково хорошо и индустриалам, и исследователям

2024-10-03 в 8:44, admin, рубрики: computational linguistics, distillation, image processing, llm, quantization, tabular data, time series, преподавание, трансформеры

Привет. Меня зовут Вика, я работаю в AIRI, преподаю в Школе Анализа Данных и Сколтехе и вместе со своими коллегами занимаюсь обработкой естественного языка, изображений и видео, а также иными задачами, где могли бы пригодиться трансформерные модели. Трансформерные архитектуры — очень мощное орудие, которые может быть применено почти во всех сферах DL, и интереснейший концепт, в котором много потенциала для исследования. А, главное, их очень легко применить к технологиям, которые способны изменить нашу жизнь здесь и сейчас.

Читать полностью »

ИИ и глобализация меняют рынок разработки. Перевод колонки из журнала The Economist

2024-10-01 в 12:45, admin, рубрики: AI, llm, OpenAI, аутстаффинг, бизнес, ИИ, искусственный интеллект

Количество разработчиков из Индии и Азии растет год от года, а активное внедрение ИИ может сделать базовую разработку более дешевой. Автор журнала The Economist рассуждает, как будет меняться мир при дальнейшем развитии технологий ИИ и аутсорсинга разработки в другие страны.

ИИ и глобализация меняют рынок разработки. Перевод колонки из журнала The Economist - 1

Читать полностью »

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения

2024-10-01 в 11:34, admin, рубрики: data engineering, llama, llm, mlops, nlp, reinforcement learning, большие языковые модели, квантизация, машинное обучение, нейронные сети

OpenAI изменили направление развития своих языковых моделей, от просто генерации текста их последняя модель перешла к решению задач с использованием логики и пошагового анализа проблемы.

До сих пор LLM генерировали текст на основе данных, использованных в процессе обучения. Веса модели хранят представление о зависимостях между текстовыми токенами, полученное из исходного корпуса данных. Соответственно, модель просто генерирует наиболее вероятные токены "по памяти", но не выполняет с их помощью никакой по-настоящему интеллектуальной работы.

o1 - это модель рассуждения Читать полностью »

От проваленного пилота до идеальной системы — как мы научились работать с LLM проектами

2024-10-01 в 9:52, admin, рубрики: AI, BigData, llm, project management, управление проектами

LLM — одно из самых сложных и интересных направлений в Data Light. Я Виктория Янышева, занимаюсь LLM-проектами в компании.

В статье расскажу, как провела с командой первый провальный пилот, какие инсайты по процессам из него извлекла, и как их после применила на успешных проектах. Поговорим про работу с асессорами и валидаторами и про то, как сделать качественный продукт в сфере, главная специфика которой — субъективизм и отсутствие единой истины.

Читать полностью »

Модели Gemini 1.5 от Google: главное о Gemini 1.5 Pro

2024-09-30 в 12:00, admin, рубрики: gemini, Google, llm, искусственный интеллект, языковые модели

Серия Gemini 1.5 представляет собой набор моделей, разработанных для обеспечения высокой производительности в выполнении разнообразных задач, включая текстовые, кодовые и мультимодальные. Эти модели могут использоваться для таких сложных задач, как синтез информации из 1000-страничных PDF-файлов, ответов на вопросы о больших репозиториях кода, содержащих более 10 тысяч строк, а также анализа многочасовых видеороликов и генерации из них полезного контента.

Читать полностью »

Искусственный интеллект эволюционирует, отстраиваясь от людей

2024-09-29 в 22:08, admin, рубрики: llm, ИИ, искусственный интеллект, машинная логика, нейросети, обучение с подкреплением, сознание

Материал ниже разбирает один достаточно своеобразный и пугающий феномен. Современные модели искусственного интеллекта находятся примерно на младенческом уровне развития. Их взросление и понимание истинной картины мира сдерживается человеческим мышлением, логикой и языком, на которых эти модели обучались. В развитии искусственный интеллект не просто отринет все человеческое, а переосмыслит его. И это происходит уже сейчас.

Читать полностью »

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

2024-09-27 в 13:10, admin, рубрики: compresia, compressa ai, llm, lora-адаптеры, selectel, большие языковые модели, квантование, машинное обучение

Привет! Все чаще коллеги из ML замечают, что компаниям нравятся возможности ChatGPT, но далеко не каждая готова передавать данные во внешние АРІ и жертвовать своей безопасностью. В результате команды начинают внедрять open source-LLM, развернутые локально. Чтобы осуществить этот процесс, инженерам нужно выполнить две задачи.

Сделать удобную «песочницу» для экспериментов, чтобы быстро проверять гипотезы для бизнеса.
Эффективно масштабировать найденные кейсы внутри компании, по возможности снижая затраты на ресурсы.

В статье рассказываем, какие есть проблемы у open source-LLM и как оптимизировать инференс модели с помощью квантизации и LoRA-адаптеров. Подробности под катом!

Автор: Алексей Гончаров, основатель платформы Compressa.ai для разработки GenAI-решений на своих серверах.
Читать полностью »

Создание своих тестов для Garak

2024-09-27 в 8:30, admin, рубрики: AI, Garak, llm, llm-attack, Malware, mlsecops, анализ уязвимостей, большие языковые модели, выявление угроз

В прошлой статье я уже говорил о тёмной стороне больших языковых моделей и способах борьбы с проблемами. Но новые уязвимости вскрываются ежедневно, и даже самые крутые инструменты с постоянными обновлениями не всегда за ними успевают. Именно поэтому команда Garak дает пользователям возможность самостоятельного расширения функционала своего инструмента.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security Читать полностью »

Moshi: GPT4-O voice mode дома (обзор)

2024-09-24 в 14:33, admin, рубрики: AI, asr, Audio, large language model, llm, ml, nlu, sound, TTS

Intro

Прежде чем приступать к самому обзору, хотелось бы обозначить отличительные черты подхода, относительно большинства диалоговых систем:

Текущие системы работают в каскадной манере: сначала «активационное» слово, затем аудио переводится в текст (ASR), текст обрабатывается и анализируется, и, наконец, ответ генерируется через TTS. Однако это медленно, теряет эмоции и «живость» разговора, и, что самое важное, все взаимодействие происходит через жесткое чередование говорящих — сначала ты, потом я, и так далее.

Moshi не опирается на сложные каскадные пайплайны (ASR, NLU, TTS), а объединяет все эти функции Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm» - 104

VLM в Нейро: как мы создавали мультимодальную нейросеть для поиска по картинкам

Всем про LLM. Как рассказать про трансформеры одинаково хорошо и индустриалам, и исследователям

ИИ и глобализация меняют рынок разработки. Перевод колонки из журнала The Economist

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения

От проваленного пилота до идеальной системы — как мы научились работать с LLM проектами

Модели Gemini 1.5 от Google: главное о Gemini 1.5 Pro

Искусственный интеллект эволюционирует, отстраиваясь от людей

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

Создание своих тестов для Garak

Moshi: GPT4-O voice mode дома (обзор)

Intro