Рубрика «mlops»
Миф о «равных весах»: что на самом деле скрывается внутри малых моделей
2026-06-04 в 8:00, admin, рубрики: AI, ai-агенты, deepseek, gpt-oss, llm-модели, mistral, mlops, phi-4, qwen, selectelVolga: движок обработки real-time данных для AI-ML — аналог Spark и Flink на Rust (Arrow + DataFusion)
2026-04-09 в 9:26, admin, рубрики: AI, Flink, kubernetes, ml, mlops, python, Rust, spark, sql, streamingКак я уместил весь MLOps-пайплайн в 10 строк
2026-04-08 в 9:01, admin, рубрики: gitlab, ml, mlflow, mlops, ruvds_статьи
В последнее время я часто работал с разными ML-проектами в GitLab. В каждом был свой .gitlab-ci.ymlЧитать полностью »
Мета-модель для диагностики обучения нейросетей
2026-03-15 в 18:15, admin, рубрики: ml, ml-инженер, mlops, python, random forest, sklearn1. Проблема
Когда мы обучаем модели машинного обучения, почти всегда возникает один и тот же вопрос:
Что именно происходит во время обучения?
Обычно мы смотрим на графики метрик и пытаемся вручную интерпретировать происходящее:
-
Модель недообучена
-
Модель переобучена
-
Имбаланс датасета.
-
Сильно шумные данные.
Можно посмотреть на learning curves и понять, что происходит:
Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference
2026-03-15 в 6:15, admin, рубрики: amd, docker, k8s, legacy, llama.cpp, llm, mlops, Ollama, radeon, rx 580TL;DR
Мы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:
hipMemGetInfo(free, total) CUDA error: invalid argument
После серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:
kernel → ROCm runtime → ggml backend
Финальное решение включало:
-
переход на kernel 6.8
-
стабилизацию ROCm runtime
-
использование llama.cpp + ROCm
-
grammar‑constrained decoding для strict sanity prompts
В итоге мы получили стабильный GPU inference:
-
~42 токен/сек
-
gpu_busy_percent → до 100%
MLOps — дитя DevOps и ML
2026-02-03 в 9:01, admin, рубрики: devops, Evidently AI, kubeflow, ml, mlflow, mlops, ruvds_статьи
Один ML-проект в проде вам или два другому? Внедрение машинного обучения в производственную среду остаётся одной из главных проблем индустрии. По статистике, 80% ML-проектовЧитать полностью »
Как мы построили систему видеоаналитики на open source и довели её до продакшена
2025-12-28 в 10:16, admin, рубрики: computer vision, CV, mlops, pytorch, yolo, видеоаналитикаМашинное обучение сейчас используется практически везде, по крайней мере если верить рекламе. И хотя для многих областей это скорее хайп, чем реальное использование, стоит признать, что ML сейчас действительно широко распространено. И, как у любого другого направления в ИТ, у машинного обучения также есть проблемы с безопасностью и в этой статье мы рассмотрим десять наиболее распространенных рисков ИБ.
Файлы, которые нельзя менять: философия TernFS и почему это гениально
2025-10-20 в 20:12, admin, рубрики: ml, mlopsXTX Markets — это ведущая компания в области алгоритмической торговли. Они ежедневно обрабатываем огромные объёмы данных, которые являются основой для наших исследований в области машинного обучения и количественного анализа. Для эффективной работы нашим исследователям нужна быстрая, надёжная и удобная система хранения данных.
Представьте себе кластер из тысяч серверов, которые одновременно обращаются к одному и тому же набору данных. Именно в таких условиях работает наша инфраструктура. Поэтому производительность файловой системы становится критически важным фактором.




