Хотите наладить разметку данных с помощью LLM или сделать чат-бота с определенной личностью? Хорошей идеей будет показать модели несколько примеров, то есть сделать in-context или few-shot learning. Такой подход позволяет с минимальными затратами, без дополнительного обучения влиять на качество работы языковой модели. Впервые этот эффект был обнаружен при применении GPT-2, которая могла отвечать на вопросы, суммаризировать и переводить тексты без явного дообучения на эти задачи. Это событие положило начало современной эпохе языковых моделей.
Рубрика «машинное обучение» - 26
Как на самом деле работает Attention
2024-12-12 в 9:02, admin, рубрики: nlp, интерпретация, машинное обучениеДилеммы, с которыми вы столкнетесь при разработке биометрических датасетов
2024-12-11 в 11:12, admin, рубрики: data light, биометрический датасет, датасет liveness, Компьютерное зрение, машинное обучение, переразметка данных, разметка данных, разметка датасета, синтетические данные
Если вы хотите научить модель машинного зрения разбираться в сортах кукурузы или, скажем, отличать пешеходов от автомобилейЧитать полностью »
Sora от OpenAI вышла: обзор, примеры видео и ограничения
2024-12-09 в 21:14, admin, рубрики: chatgpt, OpenAI, sora, видео, генерация видео, искусственный интеллект, машинное обучение, нейросети, Работа с видеоOpenAI выпустила Sora — нейросеть для генерации коротких видео. Сервисом могут пользоваться владельцы платных подписок ChatGPT Plus и Pro, но после релиза даже им приходится ждать в многочасовой очереди. В этой статье смотрим интерфейс Sora, примеры видео, разбираемся с ограничениями и пытаемся сгенерировать своё видео.

ОграниченияЧитать полностью »
Машинное обучение: Логистическая регрессия. Теория и реализация. С нуля
2024-12-09 в 15:00, admin, рубрики: искусственный интеллект, логистическая регрессия, машинное обучениеВ этой статье я привел базовые сведения о логистической регрессии и показал как сделать модель с нуля на чистом Python. Логистическая функция, обучение, метрики качества для модели классификации, реализация и небольшой разбор обучения весов.
Статья подойдет для того, кто новичок или кому интересно разобраться в том, как происходит обучение модели на низком уровне.
Введение
Логистическая регрессия (ЛогР)Читать полностью »
Обзор недавно выпущенной модели Evo для анализа геномных данных
2024-12-09 в 10:55, admin, рубрики: анализ данных, биоинформатика, биология, биотех, Биотехнологии, генетика, генетические алгоритмы, машинное обучение, машинное обучение. нейросети python, Модель данныхДавайте представим, что вы начинающий или опытный биоинформатик, или "простой смертный", который хочет углубиться в анализ биологических данных. Спойлер: биоинформатики тоже смертные! Зачастую, не у каждого хватает ценного времени на проверку огромных последовательностей геномных данных, будь то поиск различных мутаций или прогнозирование структуры белков на основе последовательности аминокислот.
Но не переживайте, в этом вам поможет искусственный интеллектЧитать полностью »
NLP: когда машины начинают понимать нас (Часть 3)
2024-12-09 в 6:00, admin, рубрики: keras, machine learning, natural language processing, nlp, python, pytorch, TensorFlow, искусственный интеллект, машинное обучение, обработка естественного языка1. Введение
В предыдущих статьях мы рассмотрели теоретические основы NLP, включая базовые понятия, такие как токенизация, стемминг, лемматизация и другие. Мы также поработали с библиотеками NLTK и spaCy и выполнили простые задания по обработке текста.
В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.
NLP: когда машины начинают понимать нас (Часть 2)
2024-12-08 в 6:30, admin, рубрики: machine learning, natural language processing, nlp, NLTK, python, spacy, искусственный интеллект, машинное обучение, обработка естественного языка, пайтон1. Введение
В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.
Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна
2024-12-08 в 6:27, admin, рубрики: llm, nlp, rag, база знаний, Большие данные, большие данные и машинное обучение, машинное обучение, разработка, языковые модели
Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем.
Читать полностью »
Биоинформатика и Evo: как искусственный интеллект меняет подходы к анализу геномов
2024-12-07 в 18:44, admin, рубрики: анализ данных, биоинформатика, биология, Биотехнологии, биохакинг, генетика, гены, днк, машинное обучение, РНКВ современном мире каждый из нас сталкивается с генетикой, будь то медицинские анализы, CRISPR-дизайн или изучение наследственных признаков. Но что, если мы могли бы заглянуть глубже, понять тайные механизмы генов и даже создать новые последовательности ДНК, пригодные для науки и медицины? Это больше не фантазия, а реальность благодаря Evo — искусственной нейросети, которая переосмысливает подходы к анализу и проектированию геномов.
