Рубрика «языковые модели» - 8

Модели Gemini 1.5 от Google: главное о Gemini 1.5 Pro

2024-09-30 в 12:00, admin, рубрики: gemini, Google, llm, искусственный интеллект, языковые модели

Серия Gemini 1.5 представляет собой набор моделей, разработанных для обеспечения высокой производительности в выполнении разнообразных задач, включая текстовые, кодовые и мультимодальные. Эти модели могут использоваться для таких сложных задач, как синтез информации из 1000-страничных PDF-файлов, ответов на вопросы о больших репозиториях кода, содержащих более 10 тысяч строк, а также анализа многочасовых видеороликов и генерации из них полезного контента.

Читать полностью »

Новый взгляд на оценку русскоязычных моделей: обновлённый бенчмарк ruMTEB и лидерборд

2024-09-23 в 12:35, admin, рубрики: Massive Text Embedding Benchmark, rumteb, векторизация, искусственный интеллект, лидерборд, эмбеддинги, языковые модели

Всем привет! Меня зовут Роман Соломатин, я представляю команду AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. Несколько месяцев назад русскоязычное сообщество разработчиков искусственного интеллекта получило инструмент для оценки моделей — бенчмарк ruMTEB (Massive Text Embedding Benchmark). Он предназначен для оценки репрезентации русскоязычных текстов и позволяет объективно сравнивать различные эмбеддинговые модели, которые превращают текст в вектора чисел, ориентированные на работу с русским языком (Читать полностью »

Сэм Альтман: «ИИ следующего поколения будет способен изобретать прорывные технологии и лечить болезни»

2024-09-19 в 16:13, admin, рубрики: llm, OpenAI, большие языковые модели, ИИ, нейросети, Сэм Альтман, языковые модели

По словам генерального директора компании Сэма Альтмана, следующее поколение систем искусственного интеллекта сможет самостоятельно выполнять задачи без участия человека, и это становится возможным благодаря таким моделям, как новая модель o1 от OpenAI.

Читать полностью »

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

2024-09-18 в 5:00, admin, рубрики: chatgpt, gpt, gpt-4, llm, machinelearning, natural language processing, o1, OpenAI, нейросети, языковые модели

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Читать полностью »

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

2024-09-11 в 4:55, admin, рубрики: chatgpt, gpt-4, llm, natural language processing, OpenAI, длиннопост, нейросети, языковые модели

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Читать полностью »

Как устроена языковая модель без перемножения матриц

2024-09-03 в 11:07, admin, рубрики: matmul-free, языковые модели

Нейросети любой архитектуры построены на перемножении матриц. Например, трансформеры из входного вектора создают (тоже перемножением) три матрицы, Q, K и V, которые затем несколько раз перемножаются на пути к получению выходного вектора. Именно умножение матриц с его кубической сложностью (если не прибегать к разного рода ухищрениям) занимает большую часть вычислительных мощностей.

Поэтому возникает естественное желание облегчить эту самую массивную часть вычислений и ускорить таким образом любую архитектуру. Периодически возникают новые подходы и идеи, тут расскажем о последней громкой статье по этой теме — Читать полностью »

Насколько ChatGPT-4o подвержен когнитивным искажениям?

2024-08-28 в 14:45, admin, рубрики: chatgpt, llm, ИИ, ИИ и машинное обучение, когнитивные искажения, языковые модели

Человеческий разум, столь сложный и удивительный, далеко не безупречен. Десятилетия исследований в области когнитивной психологии показали, что наше мышление подвержено систематическим ошибкам, известным как когнитивные искажения. Например, Канеман и Тверски открыли глаза на то, как часто мы подвергаемся влиянию искажений, даже когда абсолютно уверены в рациональности принятого решения. Мы склонны видеть мир не таким, какой он есть, а сквозь призму собственных предубеждений и упрощений. Но что, если эти же искажения проявляются и у искусственного интеллекта?

Читать полностью »

Теория игр может сделать ИИ более корректным и эффективным

2024-08-21 в 8:35, admin, рубрики: llm, игра в консенсус, искусственный интеллект, теория игр, языковые модели

Исследователи используют идеи теории игр, чтобы улучшить большие языковые модели и сделать их более последовательными.

Читать полностью »

Гайд по работе языковых моделей для начинающих

2024-08-20 в 15:32, admin, рубрики: BERT, gpt, llm, nlp, nlp (natural language processing), pytorch, TensorFlow, обработка естественного языка, языковая модель, языковые модели

Для того, чтобы распознавать естественную человеческую речь, используют специальные модели — языковые. Они умеют воспринимать содержание текста, продолжать предложения и вести осмысленный диалог.

Вместе с дата-сайентистом и биоинформатиком Марией Дьяковой подготовили подробный гайд о том, как устроены самые популярные языковые модели и что нужно знать, чтобы начать с ними работать.

Читать полностью »

Установка LLM на скромном VPS

2024-07-24 в 9:00, admin, рубрики: Chat Arena, CopilotKit, Cosmopolitan Libc, huggingface, LibreChat, llama.cpp, llamafile, llm, Ollama, OpenCompass, ruvds_статьи, Tabby, vps, языковые модели

«Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем.

Сразу упомянем, что на серверах RUVDS установлены видеокарты NVIDIA Quadro P4000 (на фото). Карты довольно слабенькие, так что подойдут скорее для проектов в образовательных целях и т. д. Тем более что под VPS выделяется максимум 1 ГБ видеопамяти. Но даже в таких спартанских условиях можно запустить LLM.

Кстати, о VPS с видеокартой. Несколько лет назад мы уже писали о сферах их применения и даже проводили тесты. Всё это можно найти здесь.Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «языковые модели» - 8

Модели Gemini 1.5 от Google: главное о Gemini 1.5 Pro

Новый взгляд на оценку русскоязычных моделей: обновлённый бенчмарк ruMTEB и лидерборд

Сэм Альтман: «ИИ следующего поколения будет способен изобретать прорывные технологии и лечить болезни»

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Как устроена языковая модель без перемножения матриц

Насколько ChatGPT-4o подвержен когнитивным искажениям?

Теория игр может сделать ИИ более корректным и эффективным

Гайд по работе языковых моделей для начинающих

Установка LLM на скромном VPS