Главная

Рубрика «веса»

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

2025-10-23 в 15:30, admin, рубрики: gpu, kv-cache, llm, vllm, VRAM, большие языковые модели, веса, инференс моделей, квантовые модели

Если вы читаете этот текст, скорее всего, вы уже пробовали запустить LLM самостоятельно и, вполне вероятно, столкнулись с одной из типичных проблем:

«Заказал GPU, загрузил модель, а она не влезла, хотя по расчетам памяти должно было хватить».

«Платим за A100, а реально используем лишь 30% ее мощности».

Привет, на связи Павел, ML-инженер в Cloud.ru. Я прошел через эти проблемы сам, поэтому не понаслышке знаю, как это может раздражать.

Читать полностью »

Теория графов. Часть третья (Представление графа с помощью матриц смежности, инцидентности и списков смежности)

2021-07-31 в 18:12, admin, рубрики: Алгоритмы, веса, граф, графики, графы, искусственный интеллект, массив, математика, матрица, машинное обучение, петли, ребра графа, Сетевые технологии, списки, теория графов

Все, что познается, имеет число, ибо невозможно ни понять ничего, ни познать без него – Пифагор

В этой статье:

Матрица смежности

Матрица инцидентности

Список смежности (инцидентности)

Взвешенный граф (коротко)

Итак, мы умеем задавать граф графическим способом. Но есть еще два способа как можно задавать граф, а точнее представлять его. Для экономии памяти в компьютере граф можно представлять с помощью матриц или с помощью списков.

Матрица является удобной для представления плотных графов в которых количество ребер (E) примерно равно количеству вершин (V).

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «веса»

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

Теория графов. Часть третья (Представление графа с помощью матриц смежности, инцидентности и списков смежности)