Рубрика «инфраструктура»

Инструкция: настройка дополнительного публичного IP-адреса на облачном сервере в Linux - 1

«Почему работает только один шлюз?» — такой вопрос может возникнуть, если добавить второй публичный IP-адрес на Linux-сервер. 

Читать полностью »

Привет, меня зовут Артем, я тимлид DevOps в одной аутстафф-компании. Столкнулись с классической ситуацией: десятки микросервисов, Kubernetes, куча observability-стека (Prometheus, Loki, Tempo, Grafana) и... постоянные ночные инциденты. «High CPU», «Pod CrashLoopBackOff», «5xx errors rising». 

У нас есть runbooks, документация, скрипты для быстрого доступа к логам. Но в 3 ночи, когда срабатывает критический алерт, тратишь время на то, чтобы проснуться, сообразить, куда залогиниться и какую команду выполнить… Мы задались вопросом: а если первым на инцидент будет реагировать не человек, а ИИ-агент?

⠀⠀

Боль, которую мы хотели решить:

1.    Читать полностью »

Источник изображения: https://images.ctfassets.net

Источник изображения: https://images.ctfassets.net

Woven City — это экспериментальный город в Японии, построенный Читать полностью »

Так получилось, что мне довелось за короткий промежуток времени заглянуть в инфраструктуру нескольких компаний, которые занимаются импорт замещением и разработкой программного обеспечения.

Цель статьи систематизировать ошибки и передать админам готовый материал для дальнейшей работы в своих инфраструктурах.

Надеюсь, что результаты труда будут интересны и обойдутся без неконструктивной критики.

Критерии, которыми я руководствовался при разработке информационной безопасности:

Ключевая проблема.

Читать полностью »

Гайд по базовому окружению для AI без знаний в MLOps - 1

Слышите из каждого утюга про «эй-ай» и хотите разобраться в этом тренде? Или просто собрались попробовать запустить ML- или AI-проект, но вас пугают настройки серверов и облаков?                                                     

Читать полностью »

Размышление о том, как изменилась инженерная культура, почему сегодняшние инструменты радикально расширили горизонты разработки и что делает молодых инженеров способными создавать системы, которые раньше выглядели мягко сказать нереально.

Читать полностью »

Основатели Gonka Даниил и Давид Либерман объездили десятки стран за последние несколько месяцев, общаясь с лидерами AI-рынка, GPU-провайдерами и государственными кластерами. Спешка понятна: до AGI осталось мало времени, а мы ещё даже не придумали, какова будет роль людей в этом будущем.

Читать полностью »

Представим, что вы запустили в облаке или на своем оборудованиии обучение модели. Выбрали конфигурацию с A100, H100 или L40S, может, даже с RTX 4090. Запускаете обучение модели, ждете, что процесс пойдет как по маслу. Но вместо э��ого в инструментах мониторинга видите, что GPU загружен на 40–60%, а то и меньше.

Причина не в «кривом коде» и не в том, что GPU «не тянут». Проблема глубже: производительность AI-кластера определяется не пиковыми терафлопсами, а самым слабым звеном в цепочке ввода-вывода. Даже самый быстрый GPU беспомощен, если данные не успевают до него «доехать». Он просто ждет.

Читать полностью »

Привет! Мы все читаем одни и те же новости: ИИ пишет код, управляет дронами и вот-вот отберёт у людей всю работу. Кажется, он везде. Но на самом деле есть одна интересная сфера, куда нейросетям пока вход закрыт. Ещё удивительнее то, что речь идёт именно о той деятельности, которая связана с рождением всех этих умных алгоритмов — дата-центры. И тут возникает парадокс: туда, где создают LLM, наотрез отказываются пускать их к рулю. Почему?

Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js