Купили гарантию на серверное железо: что может пойти не так?

в 7:20, , рубрики: Блог компании КРОК, Железо, поддержка, Серверное администрирование, серверы, сервис

image
Склад запасных частей.

Примерно всё. Мы работаем практически со всеми поставщиками серверного железа, которые только встречаются в России: от редких «суперкомпьютеров» до «привезите нам ещё один Pentium II на завод, а то прошлый рассыпался от старости». Конечно, гораздо-гораздо чаще речь идёт про новое привычное железо, но и там обычно выбор из пяти-шести вендоров. И часто надо решить, с кем связать своё будущее узами законного брака поддержки и сервиса.

Разница в том, будет ли расти прайс на постгарантийную поддержку, нужно ли будет платить за день просрочки оплаты (часто — половину годовой цены штрафом), что будет при скачке курса доллара, евро или юаня, с каким именно специалистом вы будете иметь дело и так далее. Многие вещи можно обсудить и внести в договор «на берегу», если их предвидеть. Другие влияют на окончательную стоимость владения, поскольку означают незапланированные расходы. А многим это важно, потому что проект рассчитывается на несколько лет, и на него выделяется в бюджете фиксированная сумма.

Пройдусь по пунктам того, что неприятного может встретиться. Первая история такая: умер у заказчика как-то сервер, произведенный далеко в забугорье. Клиента попросили выслать этот процессор в центр обслуживания вендора. Месяц они его разглядывали, потом сказали: да, и правда, это процессор, и он сломался. Мы перечислим вам деньги, чтобы вы могли купить себе новый такой же сами.

С кем конкретно вы будете иметь дело?

Всем хочется русскоговорящую поддержку. Но она есть не всегда, и тогда начинается интересное:

  • С американскими вендорами часто бывает, что у вас не будет хоть какого-то контакта инженера, чтобы позвонить ему лично или написать куда-то помимо формы заявки. То есть если вы поставили тикет, а на него никто не отвечает далеко за пределами SLA, то может оказаться так, что жаловаться некому вообще. Только в ту же форму заявки. Сразу проговаривайте путь эскалации для таких ситуаций, иначе софтверная поддержка (в т. ч. по драйверам и прошивкам) будет тормозить месяцами в худшем случае.
  • У крупных вендоров российских заказчиков часто обслуживает колл-центр из Азии. То есть вас ждёт двойное непонимание из-за индусского акцента английского и русского акцента английского, и «фикса сарвар» может занять больше времени, чем вам хотелось бы. Не знаю, злонамеренно или нет, но очень часто на таком стыке акцентов сотруднику поддержки проще списать что-то на непонимание и закрыть тикет, чем разбираться, чего же вы хотели. Если вы с таким сталкивались — расскажите, пожалуйста.
  • Бывает «карусель»: если есть система передачи тикета другому инженеру, то вас может ждать катание на ней почти сутки. Вы ставите срочный тикет, он падает тому, у кого через час заканчивается рабочий день. Он начинает его решать, но тикет сложный. Рабочий день заканчивается, он уходит со своего места. Тикет перенаправляется в следующую часовую зону, где есть ещё час рабочего дня. Да, там сохранена история, но всё равно это новый человек. Примерно 40 минут он вникает в вопрос, а потом передаёт тикет в следующий часовой пояс. И так далее.

В общем, напоите админа, который работал непосредственно с поддержкой нужного вам вендора, и узнайте, как у них все устроено, заранее. Особенно если вы покупаете железо для бизнес-критикал-задач. Как правило, можно получить и персональных менеджеров, и контакты для эскалации, и много чего ещё. Но нужно понимать, что это либо другой пакет поддержки (дороже), либо два-три года работы, либо особо крупный заказ или имиджевая история для вендора. То есть всё это управляется, но до сделки.

Включены ли выезды на площадку?

Часто бывает так, что выездов нет, но вашим админам обещают давать подробные нудные инструкции по монтажу, настройке и так далее. Был у нас один показательный случай: инженеры сертифицировались у немаленького вендора и получили все сертификаты по самому верхнему уровню. Затем нужно было смонтировать библиотеку с роботом. Приехала она, естественно, в разобранном виде. Инструкция по сборке представляла собой заламинированный листок А4 с двумя картинками — составом коробки и собранной библиотекой со стрелочкой для идиотов: возьмите вот это и соберите вот так. Отдельно было указано, что одну из крупных запчастей нужно втыкать вот так. Остальное само собой разумелось.

Инженеры (сертифицированные этим вендором, напомню) решили, что они же не безрукие и как-нибудь соберут. Спустя несколько часов оказалось, что инструкция всё же нужна. В итоге мы через свои каналы раздобыли вендорские инструкции не для внешнего персонала. Там всё было очень подробно и с описанием недокументированных косяков.

Ещё из выездов на площадки есть две важные особенности:

  • Иногда приезжают иностранцы, которых просто впустить на территорию объекта уже сложно начиная от допусков по ТБ и электрике. Часто ещё им нужен переводчик, если они не говорят по-английски (это касается Китая во многом).
  • У нас есть заказчики, которые работают только с персоналом с третьей группой секретности. Разумеется, надо заранее продумать, кто будет менять запчасть в вышедшем из строя сервере на таком объекте, как он к этому объекту будет ехать и как доказывать, что ему можно пройти.

А точно будет фиксированное время на предоставление запчастей?

Нет. Даже если в договоре прописано иное, может оказаться, что производитель железа может либо односторонне пересмотреть условия, либо поменять геозону для обслуживания. К нам как-то пришёл заказчик на обслуживание из-за того, что условный Урюпинск, куда он собирался перевозить сервера, не вошёл в зону обслуживания. То есть на момент начала закупки он был в этой зоне, а потом состав зоны поменяли. Просто количество городов по поддержке с фикс-таймом сократилось. То есть расширенная поддержка была куплена попросту зря.

Грамотный юрист от многого спасёт вас при составлении такого договора (особенно если вы покупаете в Москве и везёте в Ноябрьск, например). Но тут нужно понимать, что вендоры в таких ситуациях не злонамеренные, а просто соблюдают свои бизнес-интересы. И весь договор построен так, чтобы защититься от злоупотреблений покупателя и прийти к какому-то компромиссу по цене. Если бы это были разовые заказы на каждый случай, то было бы проще, но в сфере так не принято, и этому есть понятные экономические обоснования. Так вот, если вы составите «правильный» договор, то может оказаться, что такой сервис сильно дороже. И лучше просто рассмотреть другого вендора, у которого ваш город — в стандартной зоне покрытия.

Что с продлением поддержки на четвёртый год и дальше?

Если запчасть найти обычно не проблема, то вот с софтверной проблемой обычно сложнее.

Вот решили вы сэкономить и использовать такой же сервер, как донор, и дёргать из него запчасти, если потребуется. А потом происходит проблемка, для решения которой нужно обновить микрокод… И тут начинается самое весёлое. Отдельно его купить нельзя! И даже писать некуда. И даже разово его купить не выйдет. И если он вам нужен, то придётся купить поддержку железа и ПО. Так, чтобы у вас остались запчасти от аналогичного сервера и при этом можно было купить только поддержку ПО, не бывает ни у кого из вендоров.

Ещё часто бывает так, что перерывы в поддержке тоже нужно оплачивать. То есть два года вы были на поддержке, потом полгода не брали, а потом решили продлить (это типовая ситуация для госкомпаний из-за особенностей бюджетирования). Так вот, это продление будет стоить вам как минимум всего пропущенного периода, а иногда ещё и с повышающим коэффициентом за год. Вендора тоже можно понять: если так не делать, то получится, что можно копить отказы оборудования, потом взять поддержку на месяц, всё починить и снова сойти с поддержки. Но незнание этих особенностей может сыграть очень неприятную шутку: когда речь идёт про госбюджетирование, возможны задержки, а за день такой задержки может прилететь тот самый повышающий коэффициент 1,5 на весь год.

Ещё один заказчик забюджетировал себе стоимость владения железом на четыре и пять лет на основе ценника на сертификаты, купленные вместе с оборудованием. А сертификат-то был на расширенную поддержку в период гарантии, а как гарантия заканчивается, он начинает стоить на 70 % дороже.

Что ещё может случиться?

На одной из ситуаций наш заказчик (по сервисному контракту на железо) собрал просто целое поле граблей. Большая федеральная компания с госучастием. Нужно было опубликовать конкурсы на продление техподдержки инфраструктурного решения. Теперь следите за руками:

  1. Фиксированного прайс-листа у вендора на продление поддержки нет (цена зависит от суммы закупки, поддержка на абсолютно одинаковые сервера, купленные в 2018 и 2019 годах, может стоить по-разному). Дополнительных скидок на сервис нет. Точную цену никто назвать заранее не может, так как всё будет зависеть от конкретной даты начала поддержки. А в политиках компании заказчик такой формат фиксации даты не принят (потому что кто знает, сколько конкурсную документацию будут внутри согласовывать).
  2. Обязательны оплата пропущенного периода + плата за восстановление техподдержки в случае просрочки продления, что не позволяет вписаться в зафиксированную на этапе бюджетирования цену.
  3. Заказчик в виде прайс-листа получает такие же цены, как и партнёр на вход (а нам ещё 1,2 линию поддержки, между прочим, оказывать, что тоже чего-то стоит): в результате НМЦ на конкурс формируется некорректно, к заказчику никто не приходит, и торги приходится переигрывать по нескольку раз.
  4. Плата за восстановление ТП при этом растёт каждый день, вендор в соответствии со своими внутренними политиками с этим ничего сделать не может...
  5. Нельзя зафиксироваться в рублях: бюджет для заказчика всегда «плавающий».

В итоге около половины филиалов решило в этом году вообще отказаться от продления сотрудничества с этим вендором и заменить оборудование полностью.

Ещё на одном контракте была линейка хранилищ, которая отлично отработала под базовой гарантией. Потом базовая закончилась, и вендор сообщил, что пролонгации не будет, потому что «данное оборудование больше не поддерживается на территории РФ». Предложил дистрибьюторов, но они тоже не смогли помочь железом. В итоге помогали заказчику ещё год продержаться на старом железе: сформировали под них ЗИП и команду инженеров, которые во всех тонкостях этих хранилищ разбирались.

Другой производитель хранилищ выставлял разные условия поддержки на контроллеры и дисковые полки. На контроллерные полки можно было продлять гарантию ещё на два года и спокойно сопровождать. А на дисковые — никак. Таким образом, они мотивируют постоянно апгрейдить оборудование. Полмассива оставлять без поддержки на четвёртый год — не лучший план. Да, они предупредили заказчика про это изменение за год, но он купил на пять лет и бюджет согласовал на пять лет. А вендор на эти пять лет не может гарантировать поддержку, как оказалось. Не знаю, помог ли бы ему юрист при составлении договора заранее, но как минимум про такие особенности вендора надо знать.

Один из вендоров резко задрал цену на разовый ремонт для стимулирования своевременной покупки поддержки. И в сумму разового ремонта теперь входит 25 % от суммы пропущенного периода. Ну и вообще прайс-листы на запчасти всегда очень высокие, особенно для СХД (были кейсы, когда контроллер стоил в два раза больше, чем годовая поддержка, купленная вовремя).

Часто заказчиков удивляет, что вендоры не дают качать новые драйвера-прошивки-патчи после окончания поддержки. Просто учитывайте это.

Что со всем этим делаем мы

Мы считаем окончательную стоимость владения и оказываем железный сервис. То есть ещё задолго до закупки мы можем помочь с юридической и организационной обвязкой конкурса с точки зрения условий гарантийной поддержки, застраховать от возможных проблем на поддержке и помочь с методикой оценки вендоров. На стадии, когда железо уже прямо нужно купить сегодня, — с правильным бюджетированием и SLA по нему. Позже можем оказать сервис и достать почти любые запчасти в РФ.

Обычно я сталкиваюсь со сценарием, когда железо нужно купить прямо сейчас. Тут CTO должен один раз обжечься, чтобы потом понимать, как важно сначала три раза подумать: совсем не покупать поддержку, выбрать уровень критичности пониже или придумать что-то ещё. У меня так было дома с холодильником: он сломался, и я пару недель жила без него, ожидая, что не сегодня завтра всё решится. До этого случая уровень поддержки холодильника был для меня вообще чем-то настолько мелким, что даже не заслуживал упоминания. Теперь я внимательно читаю отзывы и смотрю, как решались или не решались проблемы, если они случались. С вендорами под business-critical/mission-critical-решения так надо делать с первого раза. В идеальном мире. На чёрную пятницу опять у кого-то развалился кластер, и вскрылись проблемы с вендором, который отработал по стандартной схеме, как во все остальные 365 дней в году… А у компании час простоя стоит дороже, чем весь год расширенной поддержки. А ведь можно было заранее подумать или хотя бы узнать, что и как происходит.

Поэтому я очень хорошо понимаю CTO, которые покупают поддержку, но при этом держат свой собственный ЗИП или имеют контакты кого-то, кто может приехать и быстро починить. Дополнительная перестраховка, которая стоит денег, но не дороже простоя. И всегда советую спрашивать в неформальной обстановке других работавших с вендором, как оно.

Автор: Наталия Сляднева

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js