Рубрика «llm-модели» - 9

Всё, что я узнал о запуске локальных языковых моделей

2025-01-31 в 14:53, admin, рубрики: AI, llm, llm-модели, ИИ, искусственный интеллект, локальный chatgpt, перевод

В мире, где облачные решения диктуют свои правила, локальные модели дают свободу — полную приватность, работу офлайн и отсутствие ограничений. Эта статья для тех, кто хочет впервые попробовать самостоятельно запустить LLM на своем компьютере.

Читать полностью »

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

2025-01-29 в 21:40, admin, рубрики: deepseek, DeepSeek R1, deepseek v3, llm, llm-модели, дипсик, ИИ, ии-ассистент, нейросети, нейросеть

Дипсик R1 - нашумевшая ИИ модель от китайской компании Deepseek AI. За основу взята модель Deepseek v3, возможности которой схожи с ChatGPT. Однако благодаря открытому исходному коду китайской нейросети у нее есть ряд интересных преимуществ.

В этой статье собрал все способы установки Дипсик. Т.к. китайская нейросеть с открытым исходным кодом – ее можно скачать на компьютер и использовать без Интернета. Причем, в удобном интерфейсе чат-бота.

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Переходим на официальный сайт chat.deepseek.com Читать полностью »

Telegram бот + ИИ Jlama своими руками

2025-01-29 в 17:27, admin, рубрики: AI, artificial intelligence, java, llm, llm-модели, llm-приложения, spring, telegram, ИИ, искусственный интеллект

Сегодня мы попробуем сделать свой ИИ с телеграм ботом для возможности простого общения с ней. Сразу оговорюсь, мы не будем в очередной раз использовать открытый API ChatGPT или новомодного Deepseek. Мы развернем свой полноценный ИИ локально и сынтегрируем его с телеграм ботом.

LLM модель

Telegram бот + ИИ Jlama своими руками - 1

Читать полностью »

Почему DeepSeek Janus-7B — это нечто действительно невероятное

2025-01-27 в 20:05, admin, рубрики: deepseek, janus, janus-pro, llamagen, llm, llm-модели

Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.

В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.

Читать полностью »

Субъективный взгляд на перспективы Больших Языковых Моделей

2025-01-24 в 19:26, admin, рубрики: AGI, AI, llm, llm-модели, ИИ

Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:
Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию к технологическому тупику. Главные проблемы связаны с экспоненциальным ростом вычислительных мощностей, дефицитом качественных данных и ограничениями архитектуры.

Итак, можно подвести некоторые итоги, что же мы увидели за прошедшее время.

Читать полностью »

Внедрение LLM в разработку ПО: стоит ли?

2025-01-21 в 13:52, admin, рубрики: llm, llm-модели, дообучение

Привет, на связи Юлия Рогозина, аналитик бизнес-процессов Шерпа Роботикс. Сегодня я перевела для вас статью, тема которой касается именно использования Large Language Models (LLM) как части вашего продукта, а не использования ИИ как инструмента в процессе разработки (например, таких инструментов, как Cursor или Zed AI).

Читать полностью »

OpenAI удивляет марафоном релизов, Google выпускает прорывной квантовый чип: главные события декабря в сфере ИИ

2024-12-29 в 8:03, admin, рубрики: llm-модели, дайджест ИИ, искусственный интеллект, машинное обучение, нейросети, новости ии, новости искусственного интеллекта, новости машинного обучения, новые ai-инструменты, подборка ии-инструментов

Читать полностью »

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM

2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели

RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.

Читать полностью »

Забыть не значит удалить: SURE — новый устойчивый к квантованию метод «забывания» в LLM

2024-11-22 в 12:09, admin, рубрики: llm, llm-модели, Machine unlearning, machine unlearning для LLM, SURE

Привет, на связи Елена Кузнецова, специалист по автоматизации Шерпа Роботикс. Сегодня я перевела для вас статью на очень важную тему, в ней затрагивается проблема удаления персональных и других важных данных из LLM моделей. В статье особенно интересно то, как команда учёных нашла лазейку с помощью которой смогла успешно восстанавливать такие «удалённые» данные.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm-модели» - 9

Всё, что я узнал о запуске локальных языковых моделей

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Telegram бот + ИИ Jlama своими руками

LLM модель

Почему DeepSeek Janus-7B — это нечто действительно невероятное

Субъективный взгляд на перспективы Больших Языковых Моделей

Внедрение LLM в разработку ПО: стоит ли?

OpenAI удивляет марафоном релизов, Google выпускает прорывной квантовый чип: главные события декабря в сфере ИИ

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM

Забыть не значит удалить: SURE — новый устойчивый к квантованию метод «забывания» в LLM