Azure Operation Insight Preview

в 6:39, , рубрики: azure, Microsoft Azure

Пару месяцев назад в preview в Microsoft Azure появился новый сервис- Operation Insight и у меня наконец-то дошли руки с ним разобраться.

Суть сервиса в том, что он собирает, хранит данные и дает возможность по ним искать, визуализировать их и автоматически анализировать данные, генерируемые вашей инфраструктурой. Такая возможность не нужна, пока вы не наберете критическую массу единиц для мониторинга (виртуальных машин, почтовых серверов, баз данных) и/или не появится по крайней мере 2 человека, которые занимаются администрированием этого «зверинца».
Инфраструктура генерирует логи (к примеру, Windows Events, IIS logs и т.п.), пишет информацию об изменении конфигурации машины (поставили обновление, драйверы, софт, перезагрузили машину), а вы в веб интерфейсе видите это, через поиск можете найти инциденты определенного типа и т.д. и т.п.
image

image

Одной из самых важных возможностей является добавление наиболее важных графиков и отчетов с помощью запросов на этот же экран. Сегодня нужно последить за одним — добавили, завтра за другими параметрами — удалили, добавили новый запрос. Как это может выглядеть хорошо описано в статье.

Данные можно собирать с:

  • Windows Server 2012 and Microsoft Hyper-V Server 2012
  • Windows Server 2008 and Windows Server 2008 R2, including:
    • Active Directory
    • Hyper-V host
    • General operating system
  • SQL Server 2012, SQL Server 2008 R2, SQL Server 2008
    • SQL Server Database Engine
  • Microsoft SharePoint 2010
  • Microsoft Exchange Server 2010
  • Microsoft Lync Server 2013 and Lync Server 2010
  • System Center 2012 SP1 – Virtual Machine Manager

Можно собирать данные не только с машин в облаке, но и с локальных (OnPremise).

Из личного опыта:

Каждый разработчик в своей жизни не раз сталкивался с ситуацией: возникает проблема с .net/iis приложением, читаешь в чем причина и понимаешь, что чтобы исправить проблему достаточно поставить патч на windows 2-летней давности. Ты спрашиваешь админов поставлен ли он (доступа на боевые сервера у разработчиков конечно-же нет), админы полдня занимаются другими важными делами, затем по RDP лезут на машину, сначала у них тоже нет прав, ищут кто может дать еще полдня, затем, получив, видят, что обновления нет и говорят, что 2 года обновления не ставились т.к. никто не просил. В итоге время ожидания информации — сутки.

Затем обновление ставится в план на следующие выходные (или другое технологическое окно). Проходит неделя, ты спрашиваешь: «ну что поставили?» Тебе еще через день отвечают да или нет. Как разработчику, мне бы хотелось видеть какие обновления поставлены и куда, а не ждать сутками ответа (опять же в большой конторе не всегда можно прийти ногами к людям и спросить или по телефону позвонить… поэтому приходится ждать).

Другой вариант: была с машиной проблема, вроде исправлена, но надо понаблюдать за ней несколько дней-неделю. Если у системы есть сопровождение, просишь сопровождение понаблюдать. Ну не будут же они сидеть и смотреть на машину сутками, повесят стикер, задачку в outlook сделают, по RDP откроют, метрики собирать поставят. Но у сопровождения не только эти задачи, всегда еще куча другой работы…. А через Operation Insight – повесишь выборку на экран и поглядываешь периодически, поставил нотификацию/alert и чуть-что узнаешь о проблеме.

Понятно, что проблемы мониторинга были и до Azure и никуда не денутся после нее. Есть решение на zabbix или hp open view. У Microsoft есть system Center Operation Manager, и дополнительно к нему специально для Azure написан Operation Insight.

Operation Insight и Operation Manager

OpIn может использовать данные, собранные в том числе через Operation Manager. Общая схема ниже.
image

Operation Insight и system center advisor

Нет больше advisor как такового: он полностью вошел в состав Operation Insight.
Поэтому вопрос «Чем одно отличается от другого?» — это вопрос «Чем целое отличается от его части?»

Как это работает. Настройка

На машину, за которой производится мониторинг, ставится агент, который собирает с нее данные. Инсталлятор можно прямо с портала выкачать, затем ставится на целевую машину и конфигурируется. Вся настройка агента — это буквально пара опций- нужно указать Workspace ID и Primary Workspace Key.
После того, как агент на машину поставлен, нужно включить компьютер в OpInsight для мониторинга.
По необходимости прорубается настройка в firewall.

Intelligent Pack

Intelligent Pack — это набор правил визуализации данных, которые вы можете скачать для расширения функциональности OpIn. Существующие пакеты представлены в галерее . Вот 2 примера таких пакетов:

  • Alert Intelligent Pack — сколько, когда и каких нотификаций о проблемах или потенциальных проблемах было, очень помогает обнаруживать грядущий апокалипсис и начать действовать до его наступления.
    image
    image
  • SQL Server Intelligent Pack — Как не трудно догадаться, это пакет для анализа и планирования мероприятий по SQL Server для его поддержки и снижения риска с ним связанного.
    “Recommendations are categorized across six focus areas which helps your quickly understand the risk and health of your infrastructure and to help you easily take action to decrease risk and improve health.
    The recommendations made are based on the knowledge and experiences gained by Microsoft engineers from based on thousands of customer visits.”

    Общая страница
    image

    Детальная информация

    image

    Более подробно можно почитать на пример тут или в блогах тут и тут.

Заметки

  • Есть клиент для просмотра на windows phone.
    image
    Описание есть в блоге.
    Если хотите клиент для IOS, Android просят проголосовать за такие клиенты (хотят понять нужно ли оно вообще)
  • Сейчас, во время preview, сервис хостится в США, но доступ мы можем получить откуда угодно. msdn.microsoft.com/en-us/library/azure/dn873945.aspx
  • Microsoft в статье про безопасность долго объясняет, что ваши данные даже в облаке останутся только вашими. Что используется https, что ваши данные хранятся отдельно от данных других аккаунтов и т.д. и т.п. go.microsoft.com/fwlink/?LinkId=517154 azure.microsoft.com/en-us/documentation/articles/operational-insights-security/
  • Я смотрел многие сервисы azure, и обсуждение новых фичей идет очень активно, в отличии от большинства других сервисов.
Цены:

Есть 3 различных тарифных плана (Tier).
Free, Standard, Premium. Все различия в этих планах — это объем собираемых за день данных и время хранения этих данных.
image
Лично мне не понятно, почему бы не сделать бессрочное хранение данных и возможность почистить старые данные по кнопке?! Т.к. не хочется потерять знания о серьезных инцидентах старше 12 месяц.

Ссылки:

Автор: SychevIgor

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js