Рубрика «llm» - 93

Опенсорс на арене: правда ли так хороша Llama 3.1 405B?

2024-08-10 в 14:35, admin, рубрики: chatgpt, claude, llama, llm, meta, ИИ, ИИ и машинное обучение

Совсем недавно Meta представила миру Llama 3.1 405B - новую открытую модель, бросающую вызов признанным лидерам, таким как GPT-4o и Claude-3.5 Sonnet.

Опенсорс на арене: правда ли так хороша Llama 3.1 405B? - 1

Читать полностью »

Освоение любой темы с помощью искусственного интеллекта и метода Фейнмана

2024-08-08 в 15:00, admin, рубрики: chatgpt, llm, искусственный интеллект, машинное обучение, методы обучения, обучение, учебный процесс, фейнман

Когда в последний раз вы сталкивались с трудной для понимания темой? Или проводили часы за просмотром обучающих видео на YouTube?

Существует множество эффективных методик обучения, позволяющих усвоить сложные концепции и обрести уверенность в своих знаниях. Если вы, как и я, постоянно стремитесь к саморазвитию, то понимаете важность правильного подхода к обучению. Одним из наиболее простых и действенных методов является техника Фейнмана.

В этой статье я расскажу, как эффективно применять метод Фейнмана и использовать искусственный интеллект для восполнения пробелов в знаниях.

Читать полностью »

LLM и ее невозможный ASCII art

2024-07-27 в 11:18, admin, рубрики: llm, искусственный интеллект, искусство, нейросети

LLM и ASCII art - казалось бы взаимоисключающие понятия. Какое отношение лингвистическая модель может иметь к графическим образам?

Читать полностью »

Установка LLM на скромном VPS

2024-07-24 в 9:00, admin, рубрики: Chat Arena, CopilotKit, Cosmopolitan Libc, huggingface, LibreChat, llama.cpp, llamafile, llm, Ollama, OpenCompass, ruvds_статьи, Tabby, vps, языковые модели

«Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем.

Сразу упомянем, что на серверах RUVDS установлены видеокарты NVIDIA Quadro P4000 (на фото). Карты довольно слабенькие, так что подойдут скорее для проектов в образовательных целях и т. д. Тем более что под VPS выделяется максимум 1 ГБ видеопамяти. Но даже в таких спартанских условиях можно запустить LLM.

Кстати, о VPS с видеокартой. Несколько лет назад мы уже писали о сферах их применения и даже проводили тесты. Всё это можно найти здесь.Читать полностью »

Локальные LLM в разработке: а почему бы и да?

2024-07-10 в 13:32, admin, рубрики: llm, бекенд, ИИ, нейросети, разработка

Меня зовут Антон Гращенков, и я занимаюсь развитием Java в Альфа-Банке. Программированием увлекаюсь ещё со школы: писал на множестве разных языков — от Pascal до TypeScript, мне это просто нравится. В статье я на примерах покажу, для каких задач я использую локальные модели. Да, существует много инструментов доступных в облаке, — тот же ChatGPT, Copilot или YandexGPT. Однако можно запустить такую модель и локально, и сделать это крайне просто.

Ведь если хочется, то почему бы и да?

Читать полностью »

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

2024-06-11 в 9:00, admin, рубрики: gpu, llm, ml, open source, машинное обучение, опенсорс яндекса, языковые модели, яндекс

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них.

Читать полностью »

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

2024-06-07 в 8:00, admin, рубрики: huggung face, llm, machine learning, selectel, sentiment analysis, аналитика, комментарии, комментарии на хабре, машинное обучение, хабр

Каждый месяц в блоге Selectel на Хабре появляется 35-40 публикаций. Сбор статистики по ним мы давно автоматизировали, но до последнего времени не охватывали sentiment-анализ, то есть оценку тональности комментариев средствами машинного обучения.

У нас есть своя ML-платформа, серверное железо и опыт в развертывании IT-инфраструктуры. Вполне логично, что в какой-то момент возник вопрос: что, если проанализировать эмоциональный окрас комментариев в блоге на Хабре с помощью LLM?

Под катом рассказываем, что из этого получилось.Читать полностью »

ChatGPT как мутная ксерокопия Интернета

2024-05-12 в 18:11, admin, рубрики: chatgpt, llm, natural language processing, Алгоритмы, искусственный интеллект

Читать полностью »

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

2024-04-18 в 5:30, admin, рубрики: AI, llama, llm

Бывают ситуации, когда жизненные обстоятельства не позволяют использовать ChatGPT и приходится разворачивать LLM локально. Например бабушка не разрешает. Так можно остаться и без AI, а этого мужики точно не поймут. Есть ли какие-то способы решения этой проблемы?

Если у вас такая ситуация – можете выдохнуть, решение есть. На данный момент существуют следующие варианты:

1. Проприетарные модели:

a. Anthropic – в настоящее время сравним или превосходит по качеству ChatGPT 4.0 на некоторых задачах и обладает большим контекстным окном, давая возможность решать многие задачи, не прибегая к RAG и другим гибридным методам

b. Читать полностью »

Как мы научили YandexGPT пересказывать видео

2024-03-04 в 7:00, admin, рубрики: llm, yagpt, yalm, видео, пересказ, яндекс, яндекс.браузер

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm» - 93

Опенсорс на арене: правда ли так хороша Llama 3.1 405B?

Освоение любой темы с помощью искусственного интеллекта и метода Фейнмана

LLM и ее невозможный ASCII art

Установка LLM на скромном VPS

Локальные LLM в разработке: а почему бы и да?

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

ChatGPT как мутная ксерокопия Интернета

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Как мы научили YandexGPT пересказывать видео