Рубрика «k8s»

Если коротко — плохо живут.

Я последние полгода копаю эту тему и хочу поделиться тем, что увидел. Заодно показать инструмент, который пишу по результатам. Возможно, кто-то узнает свою ситуацию и поможет мне понять, насколько проблема массовая.

С чего всё началось

В 2022–2024 западные CNAPP-платформы закрыли доступ для российских компаний. Wiz, Prisma Cloud, Lacework, Orca — все они либо ушли сами, либо отвалились после санкций. Кто работал с этими инструментами, тот помнит — это была основная рабочая лошадка для аудита Kubernetes в облаке.

Читать полностью »

TL;DR

Мы пытались запустить LLM inference на старой AMD RX580 (8 VRAM) через ROCm в Kubernetes. GPU корректно определялся, VRAM использовалась, но inference падал с ошибками вида:

hipMemGetInfo(free, total) CUDA error: invalid argument

После серии экспериментов с ROCm userspace, Docker‑образами и Kubernetes deployment выяснилось, что проблема лежит на границе:

kernel → ROCm runtime → ggml backend

Финальное решение включало:

  • переход на kernel 6.8

  • стабилизацию ROCm runtime

  • использование llama.cpp + ROCm

  • grammar‑constrained decoding для strict sanity prompts

В итоге мы получили стабильный GPU inference:

Катастрофоустойчивый Kubernetes: как использовать балансировщик MetalLB с BGP-anycast - 1

Клиенты часто спрашивают, как построить геораспределенный и катастрофоустойчивый KubernetesЧитать полностью »

Цели

  • Настроить мониторинг managed PostgreSQL Yandex Cloud;

  • Деплой в k8s;

  • Сервис дисковеринг (экспортёр самостоятельно обнаруживает кластера и хосты БД);

  • Минимизировать нагрузку от экспортёра на БД и Victoria Metrics (собирать только нужные метрики с заданной частотой - т.к. не все метрики нужно пересчитывать при каждом скрейпе);

  • Избежать шумного поведения экспортёра (большой packet-rate на ноде).

Читать полностью »

Предположим, вам необходимо мигрировать ваш кластер k8s в другой vlan или просто сменить ip адреса. Насколько это необходимо каждый решает сам. Будем считать, что перенос нагрузки ямлами на другой кластер затруднён или у кластера специфические настройки.

В качестве начальных условий: кластер on prem с root доступом на узлы, установлен через kubeadm или kubespray, calico как cni. В нашем случае под ногами ubuntu на узлах кластера. Балансировщик kube api отсутствует. Если у вас кластер установлен the hard way , то статья вам не нужна, вы сами всё умеете.

Читать полностью »

В этой статье разберу установку с минимальными усилиями с использованием Helm и локального однонодового кластера Kubeadm.

Создаём кластер:

Установка Langfuse в Kubernetes - 1

Добавляем и обновляем репо с Langfuse:

helm repo add langfuse https://langfuse.github.io/langfuse-k8s
helm repo update

Создаём файл values.override.yamlЧитать полностью »

Сокращаем расходы на Kubernetes: практические подходы для pet-проектов и продакшена - 1

Привет! Я — Дима, менеджер продукта Managed KubernetesЧитать полностью »

Kubernetes на пальцах: самое простое объяснение, что это такое - 1

Вы наверняка знаете, KubernetesЧитать полностью »

Выделенные серверы + Kubernetes: практическое руководство - 1

Привет! Я Максим, инженер по тестированию в Selectel. Недавно мы провели технический воркшоп по работе с Kubernetes на выделенных серверахЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js