Рубрика «CLIP»

Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков

2025-12-28 в 14:46, admin, рубрики: CLIP, DIY, pet-project, python, qdrant, ZeroTier, векторные базы данных, оптимизация, поиск изображений

Как я собрал семантический поиск по 17 миллионам картинок, не разорившись на AWS

Зачем это всё

Я занимаюсь визуальными искусствами и фронтендом более 10 лет. Для креативной работы мне постоянно нужны референсы, причём основанные на ощущении, визуальном стиле, том, что на английском (да и у нас зачастую) называют vibe.

Был замечательный проект same.energy, который решал именно эту задачу. Когда он перестал работать, я почувствовал себя без рук. И, как инженер, решил не ждать, а собрать свой инструмент.

Задача звучала амбициозно: проиндексировать датасет на Читать полностью »

Литературный обзор на статью: StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators

2025-09-02 в 9:18, admin, рубрики: AI, CLIP, CV, DS, ml, stylegan, StyleGAN-NADA

StyleGAN-NADA (No Annotation Domain Adaptation) - метод, разработанный специалистами из Tel Aviv University и NVIDIA Research, позволяющий адаптировать генеративную модель (StyleGAN2) к новому домену без единого изображения, использующий только семантическую силу больших моделей, предварительно обученных контрастивным методом на тексте и изображениях (СLIP). На рисунке 1 представлены возможности метода StyleGAN-NADA.

Читать полностью »

RecSys + DSSM + FPSLoss is all you need

2025-06-08 в 12:10, admin, рубрики: CLIP, cross-entropy, FPS, loss, loss-функции, machine learning, pairCE, recsys, tripletloss, рекомендательные системы

Упрощать и искать похожие детали, очень полезный навык! Предлагаю быстро пробежаться и попробовать найти ту самую серебряную пулю в RecSys !

Введение

Читать полностью »

CLIP или SigLIP. База по Computer vision собеседованиям. Middle-Senior

2025-05-09 в 21:02, admin, рубрики: CLIP, ComfyUI, ml, SigLIP, Компьютерное зрение, собеседование в IT, собеседование вопросы

Вопросы о CLIP-моделях встречаются почти на каждом техническом собеседовании.
Неважно, занимаетесь ли вы видеоаналитикой, создаёте генеративные модели или работаете над поиском по изображениям — CLIP и его потомки (BLIP , SigLIP Читать полностью »

Вместо тысячи слов: как картинки помогают в текстовом Поиске?

2024-09-17 в 11:17, admin, рубрики: CLIP, computer vision, CV, nlp, Okko, обложки, онлайн кинотеатр, поиск, поисковые алгоритмы, фильмы

Всем привет! Меня зовут Дима. Я работаю в Поиске Okko и в этой статье хочу рассказать, насколько картиночные модели полезны для задачи Поиска и для чего мы используем их в наших пайплайнах.

Читать полностью »

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

2024-01-18 в 0:50, admin, рубрики: CLIP, computer vision, dinov2, Fondation Models, I-Jepa, InternImages, InternVideo, машинное зрениее, мультимодальные модели, нейронные сети

Прошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. И когда можно будет выгнать на мороз лишних "ресерчеров".

Поговорим о следующем:

Что вообще такое "предтрейненные сети"
Где они используются?
Можно ли заменить ими обучение/разработчиков?
Какие есть ограничения?
Что будет дальше?

Читать полностью »

Шерудим под капотом Stable Diffusion

2022-09-14 в 14:11, admin, рубрики: CLIP, dalle, dalle-2, huggingface, natural language processing, OpenAI, stable diffusion, stablediffusion, unet, VAE, искусственный интеллект, машинное обучение, обработка изображений

Вероятно вы уже слышали про успехи нейросетей в генерации картинок по текстовому описанию.

Я решил разобраться, и заодно сделать небольшой туториал, по архитектуре Stable Diffusion. Сегодня мы не будем глубоко погружаться в математику и процесс тренировки. Вместо этого сфокусируемся на применении и устройстве основных компонент: UNet, VAE, CLIP.

Читать полностью »

Кластеризация изображений с помощью нейросети CLIP

2022-01-13 в 10:45, admin, рубрики: CLIP, clustering, clusterization, data engineering, dbscan, machine learning, OpenAI, python, umap, Блог компании FunCorp, искуственный интеллект, машинное обучение, нейросети, обработка изображений

В статье пойдёт речь о том, как можно автоматически разделить датасет изображений на кластеры, которые поделены по качественному контекстному признаку, благодаря эмбедингам из нашумевшей нейронной сети CLIP от компании Илона Маска. Расскажу на примере контента из нашего приложения iFunny.

Читать полностью »

Рисуем вместе с CLIP Guided Diffusion HQ

2021-11-03 в 13:00, admin, рубрики: CLIP, ruvds_статьи, Блог компании RUVDS.com, будущее здесь, генерация изображений, дизайн, машинное обучение, нейросети, обработка изображений

UPD: эта статья была написана до выхода интереснейшего материала о нейросети ruDALL-E. Мы решили всё равно её опубликовать — таким образом у читателей будет возможность сравнить изображения, сгенерированные отечественной и зарубежной сетями. Дальнейший текст публикуется без изменений.

Рисуем вместе с CLIP Guided Diffusion HQ - 1

Во времена старого Баша мне запомнилась одна цитата:

kok:
Подскажите какой прогой перегонять книги из txt в mp3
Izzzum:
^^^^^ No Comment а почему сразу не в 3gp или XviD?
kok:
А в каком по твоему формате аудиокниги?
kok:
Или ты думаешь, что какойто дурень сидит и начитывает перед микрофоном?

Что ж, если не предъявлять слишком высоких требований к реалистичности результата, можно сказать, что сегодня у нас такие «проги» есть. Речь, конечно же, о нейросетях, которые умеют генерировать практически любые виды контента.

Читать полностью »

Тихая революция и новый дикий запад в ComputerVision

2021-04-20 в 23:14, admin, рубрики: CLIP, cnn, Deit, DETR, Pose3d, RANSAC, SWIN, Transformers, Visual transformer, VIT, Алгоритмы, Анализ и проектирование систем, Блог компании Recognitor, машинное обучение, обработка изображений

Казалось бы, революция с Computer Vision уже была. В 2012 году выстрелили алгоритмы основанные на сверточных нейронных сетях. Года с 2014 они дошли до продакшна, а года с 2016 заполонили все Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «CLIP»

Нейропоисковик на 17 миллионов картинок: OpenCLIP, Qdrant и ZeroTier вместо облаков

Зачем это всё

Литературный обзор на статью: StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators

RecSys + DSSM + FPSLoss is all you need

Введение

CLIP или SigLIP. База по Computer vision собеседованиям. Middle-Senior

Вместо тысячи слов: как картинки помогают в текстовом Поиске?

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

Шерудим под капотом Stable Diffusion

Кластеризация изображений с помощью нейросети CLIP

Рисуем вместе с CLIP Guided Diffusion HQ

Тихая революция и новый дикий запад в ComputerVision