
Помните то самое платье?
Читать полностью »

Помните то самое платье?
Читать полностью »
В феврале 2023 года, чуть более чем через год после запуска ChatGPT, Университет Вандербильта разослал своим студентам электронное письмо в связи с трагической стрельбой на территории кампуса Мичиганского государственного университета.
«Недавняя стрельба в Мичигане — трагическое напоминание о том, как важно заботиться друг о друге», — говорилось в начале письма. Мелким шрифтом внизу сообщения шло примечание: «перефразировано из ChatGPT от OpenAI».
Студенты сразу же выразили протест.
Всем привет!
Сегодня я хочу рассказать о внедрении финансового генеративного чат-бота в маркетплейс Выберу.ру и о том опыте, который был приобретен за время запуска этого проекта. Эта статья написана с целью объяснить концепции и трудности, с которыми мы с командой столкнулись, поэтому постараюсь обойтись без особого погружения в технические детали.
Приступим.
Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.
Этот пост будет полезен людям, кто хочет разобраться в локальных моделях, особенно использующим их, как инструмент в создании контента, арта и дизайна (контекст нейросетей - image и video). Так же поговорим о выборе видеокарты и параметрах влияющих на генеративные workflow.
Для начала - график с оптимальными и минимальными значениями VRAM для image и video моделей.
Одни из самых перспективных решений среди генеративных моделей принадлежат к классу LDM (latent diffusion models): Stable Diffusion, Wan, Flux и многие другие. Превращение шума в изображение происходит в два этапа: сперва диффузионная модель создаёт латент, который затем декодируется в изображение намного большего размера. За декодирование и формирование латентного пространства в большинстве моделей этого класса отвечает токенизатор изображений. Таким образом, качество этой модели напрямую влияет на результаты генерации.
Я – режиссер с «традиционным» кинообразованием. Взявшись работать с генеративным музыкальным видео для песни ЛИКО «Девочка-стесняшка», я хотела использовать свои знания для того, чтобы обогатить плоские ИИ-кадры.
Я опишу опыт придания клипу «кинематографичности», понимая под этим термином не кадры с дрона, панорамы, «флюшки» от солнца, контрастность изображения и тп, а набор вполне конкретных качеств, прежде всего, глубины кадра, которая не появится от употребления волшебного слова cinematic в промте.

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут ВандерЧитать полностью »
Команда российских ученых, работающих в МФТИ, Иннополисе и Сколково, совершила научный прорыв в области генеративного моделирования — создании новых изображений, похожих на настоящие фотографии или рисунки. Они разработали новый метод, который значительно ускоряет и упрощает процесс генерации в теории и на практике. Их результаты опубликованы в материалах конференции NeurIPS 2024.