Рубрика «amd»

Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест

2026-05-27 в 9:00, admin, рубрики: AI, amd, llm, ml, Nvidia, SambaNova, selectel, дайджест, железо и софт, искусственный интеллект

Читать полностью »

Локальный ИИ на «древнем» железе: выжимаем максимум из AMD RX 580 через Vulkan в Fedora (Llama 3.1, DeepSeek, Qwen 3.5)

2026-05-10 в 12:46, admin, рубрики: amd, Fedora, llama 3.1, n8n, Ollama, podman, qwen 3.5

Я решил проверить, на что способен мой старый компьютер с Radeon RX 580 под управлением Fedora. В этой статье я пошагово разберу, как завести современный ИИ-стек (Ollama, n8n, Open WebUI) через Vulkan без боли с ROCm, и почему 15-35 токенов в секунду на железе 2017 года — это реальность, доступная каждому.

Мой компьютер у меня с 2018 года. FedoraЧитать полностью »

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

2026-04-08 в 8:27, admin, рубрики: amd, gpu, inference, llm, local ai, metal, qwen, zig

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.

Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

Читать полностью »

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

2026-03-15 в 6:15, admin, рубрики: amd, docker, k8s, legacy, llama.cpp, llm, mlops, Ollama, radeon, rx 580

TL;DR

Мы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:

hipMemGetInfo(free, total) CUDA error: invalid argument

После серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:

kernel → ROCm runtime → ggml backend

Финальное решение включало:

переход на kernel 6.8
стабилизацию ROCm runtime
использование llama.cpp + ROCm
grammar‑constrained decoding для strict sanity prompts

В итоге мы получили стабильный GPU inference:

~42 токен/сек
gpu_busy_percent → до 100%

Читать полностью »

Ящик пAMDоры — изучаем AMD PSP

2026-01-22 в 12:29, admin, рубрики: amd, positive technologies, ps5, raspberry pi pico, sony playstation 5, TOCTOU, реверс-инжиниринг

Помните переполох с Intel ME, что устроили наши коллеги из PT SWARM? Тот, где в проприетарной прошивке, которая имеет максимальный доступ к вашей системе, обнаружили уязвимость, вследствие чего можно запустить свой код, включить отладку и, вообще, сделать с чипсетом практически всё, что заблагорассудится? Теперь такое же можно проделать и с AMD! Мы в Positive Labs решили разобраться в ситуации и исследовать ту самую плату, на которой недавно нашли уязвимость.

Читать полностью »

Стоит ли сейчас переходить на AM5 или подождать AM6

2026-01-15 в 11:02, admin, рубрики: amd, cpu, xcom-shop, сборка пк

Читать полностью »

Acemagic M1A Pro+: новый мини-ПК с Ryzen AI Max+ 395. Что за зверь?

2026-01-09 в 12:00, admin, рубрики: amd, intel, selectel, гаджеты, мини-пк

Читать полностью »

Большим GPU не нужны большие PC

2026-01-05 в 13:01, admin, рубрики: amd, llm, Nvidia, radeon, ruvds_переводы, бенчмарки, локальные нейросети

С тех пор, как я научил графические карты AMD, Intel и Nvidia работать с Raspberry Pi, меня мучил вопрос:

Читать полностью »

Ваш ноутбук пока не готов к LLM, но скоро это изменится

2026-01-04 в 9:01, admin, рубрики: AGI, AI, amd, microsoft, ruvds_перевод, апгрейд железа, искусственный интеллект, Ноутбуки

Бьюсь об заклад, что ПК в вашем офисе вряд ли потянут большие языковые модели (LLM).

Читать полностью »

Запуск x64 программ на ARM или почему вы не захотите этим заниматься

2025-12-08 в 16:27, admin, рубрики: amd, amd64, arm64, Box64, FEX, i386, запуск x64 на arm, игры на Linux, эмуляция x64

Здравствуй!

Пришло время для моей новой статьи по Linux и в этот раз довольно необычной. Я буду разбирать способы “подружить” x64 архитектуру с компьютером на ARM64 (AArch64) архитектуре.

Вообще, тут стоит сделать небольшое отступление и рассказать про развитие компьютеров в общем.

Начну я далеко не с начала, а с момента зарождения настольных персональных компьютеров, так как до этого компьютеры были роскошью и обычный человек не мог у себя дома иметь огромный ЭВМ на условном UNIX.

Я не собираюсь в данном историческом экскурсе рассказывать про Apple II или Commodore Amiga, или ZX Spectrum 64/128K. Смысла имеет довольно мало.

Информация

Комментарии

Рекомендуем

Рубрика «amd»

Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест

Локальный ИИ на «древнем» железе: выжимаем максимум из AMD RX 580 через Vulkan в Fedora (Llama 3.1, DeepSeek, Qwen 3.5)

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

Ящик пAMDоры — изучаем AMD PSP

Стоит ли сейчас переходить на AM5 или подождать AM6

Acemagic M1A Pro+: новый мини-ПК с Ryzen AI Max+ 395. Что за зверь?

Большим GPU не нужны большие PC

Ваш ноутбук пока не готов к LLM, но скоро это изменится

Запуск x64 программ на ARM или почему вы не захотите этим заниматься

Читать полностью »