- PVSM.RU - https://www.pvsm.ru -

Зачем нужна система мониторинга на кристалле

Британский стартап UltraSoC представил on-chip-технологию для отслеживания характеристик микросхем без ущерба для производительности. Рассказываем, как устроено решение.

Зачем нужна система мониторинга на кристалле - 1 [1]
/ фото 83DegreesMedia [2] CC BY [3]

Зачем внедрять системы мониторинга в чип

Гетерогенные устройства строятся из нескольких блоков. Ими могут выступать процессоры, сопроцессоры или интегральные схемы ASIC. Специализация вычислительных модулей повышает производительность всей системы, но «многокомпонентный состав» приводит к сложностям с оптимизацией — каждому аппаратному блоку требуется настройка.

Проблема усугубляется, если чипы используются крупным дата-центром. Мониторинг обширной инфраструктуры — задача не из легких. Специализированные программные решения зачастую наносят ущерб эффективности работы вычислительных систем. К примеру, утилита для измерения пропускной способности канала iPerf [4] снижает [5] производительность сети на 10–15%.

Для решения этой проблемы UltraSoC внедрили инструменты для мониторинга прямо на чип. Компания разработала [6] ряд логических полупроводниковых модулей, каждый из которых отвечает за одну из задач — мониторинг, отладку, обеспечение безопасности. Производители чипов могут использовать эти модули и вытраливать их на одной схеме с процессорами, GPU, сетевыми интерфейсами. Это позволяет собирать данные со всех компонентов микросхемы «на месте» без инвазивных программных решений. Эта технология уже адаптирована [7] для работы со стандартными архитектурами: от ARM и RISC-V до MIPS и Xtensa.

Устройство системы

В UltraSoC предлагают [8] порядка тридцати модулей, которые можно компоновать в зависимости от особенностей конкретной системы на кристалле (SoC). Модули делятся на три класса:

  1. Блоки аналитики — контролируют и мониторят компоненты микросхемы;
  2. Блоки обмена сообщениями — связывают модули UltraSoC между собой;
  3. Коммуникаторы — интерфейсы для связи с внешними системами и внутренними компонентами.

К примеру, для микропроцессоров на базе архитектуры RISC-V вся система может выглядеть [9] следующим образом:

Зачем нужна система мониторинга на кристалле - 2

Полученные данные о состоянии компонентов чипа можно выводить [5] через различные интерфейсы: USB, Ethernet, PCI-Express и даже Wi-Fi. После эту информацию можно загрузить в любую аналитическую систему для поиска аномалий в работе компонентов.

Потенциал и недостатки решения

Разработчики из UltraSoC говорят, что их система найдет применение в дата-центрах и поможет облачным провайдерам мониторить масштабную облачную инфраструктуру. Так как параметры системы на кристалле отслеживаются с помощью аппаратных средств, которые (в отличие от программных) не оказывают влияние на производительность, операторы ЦОД смогут получать актуальные данные о состоянии серверов в реальном времени.

Из-за того что технология оценивает работу низкоуровневых компонентов напрямую, она поможет быстрее определять причину так называемых гейзенбагов [10] — «плавающих ошибок», которые сложно отловить из-за того, что они регулярно меняют свойства.

Но прежде чем технология найдет широкое применение, команде UltraSoC придется [5] убедить производителей внедрить решение в свои чипы. Его реализация усложнит бизнес-процессы, приведет к удорожанию производства и увеличению цены микросхем. Поэтому многие компании могут отказаться, сославшись на то, что клиентам будет дешевле самостоятельно воспользоваться сторонним ПО для мониторинга.

Но ряд производителей все же хочет опробовать продукт. Например, в компании Esperanto собираются внедрить [11] технологию UltraSoC в тысячу процессоров на базе RISC-V и ускорители AI/ML, чтобы отслеживать их производительность.

Альтернативные разработки

Другие организации тоже разрабатывают [12] on-chip системы. В частности, специальные сенсоры для отслеживания напряжения и температуры (PVT — Process, Voltage, Temperature). Они заточены под работу в системах на кристалле и ASIC. В начале прошлого года Moortec заручились [13] поддержкой производителя чипов TSMC и реализовали свою технологию в 12-нм микросхемах. В компании уверены [14], что процессоры с системами мониторинга «на борту» найдут применение в ЦОД, мобильных устройствах, системах ИИ, IoT и проч.

Еще один проект — «умные» PVT-сенсоры — стал [15] результатом совместной работы компаний. Комбинация цифровых систем мониторинга и анализа UltraSoC и физических сенсоров Moortec позволяет комплексно отслеживать состояние SoC и оптимизировать нагрузку в режиме реального времени.

Что ждет технологию в будущем

Разработчики из UltraSoC считают [11], что рост популярности высокотехнологичных решений (AI, ML, IoT), а также переход на гетерогенные системы сделают встроенные инструменты мониторинга незаменимыми.

В компании планируют сделать архитектуру решения более гибкой и настраиваемой. Для этого в UltraSoC начали разрабатывать UltraDevelop 2. Это — интегрированная среда разработки (IDE), с помощью которой можно конфигурировать, отлаживать и оптимизировать параметры компонентов чипа. Её релиз намечен на второй квартал 2019 года.


О чем мы пишем в корпоративном блоге:

Несколько постов из нашего Telegram-канала:

Автор: ИТ-ГРАДовец

Источник [22]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/vy-sokaya-proizvoditel-nost/310910

Ссылки в тексте:

[1] Image: https://habr.com/ru/company/it-grad/blog/442788/

[2] 83DegreesMedia: https://www.flickr.com/photos/83degreesmedia/8472109868/

[3] CC BY: https://creativecommons.org/licenses/by/2.0/

[4] iPerf: https://ru.wikipedia.org/wiki/Iperf

[5] снижает: https://www.nextplatform.com/2019/02/26/on-chip-wizardry-to-optimize-performance-at-scale/

[6] разработала: https://www.ultrasoc.com/company/about-us/

[7] адаптирована: https://riscv.org/wp-content/uploads/2016/11/Tue1645-RISC-V-debugging-Panesar-UltraSoC.pdf

[8] предлагают: https://www.ultrasoc.com/technology-2/ultradebug-modules/

[9] может выглядеть: https://www.ultrasoc.com/wp-content/uploads/2018/02/UltraSoc_for_RISC-V_architecture.pdf

[10] гейзенбагов: https://ru.wikipedia.org/wiki/%D0%93%D0%B5%D0%B9%D0%B7%D0%B5%D0%BD%D0%B1%D0%B0%D0%B3

[11] внедрить: https://www.ultrasoc.com/ultrasoc-extends-chip-analytics-architecture-age-machine-learning-artificial-intelligence-parallel-computing/

[12] разрабатывают: https://www.moortec.com/technology/technology-overview/

[13] заручились: https://www10.edacafe.com/nbc/articles/1/1558177/Moortec-Announce-their-Embedded-In-Chip-Monitoring-Subsystem-TSMC-12FFC

[14] уверены: https://semiengineering.com/toward-on-chip-monitoring/

[15] стал: https://nmi.org.uk/moortec-and-ultrasoc-collaborate-to-enable-next-generation-smart-pvt-sensors/

[16] Как разместить 100% инфраструктуры в облаке и не пожалеть об этом: https://iaas-blog.it-grad.ru/kejsy/onlajn-uslugi-dlya-b2cb2b-iz-oblaka/

[17] Бессерверные вычисления в облаке: тренд современности или необходимость?: https://iaas-blog.it-grad.ru/tendencii/besservernye-vychisleniya-v-oblake-trend-sovremennosti-ili-neobxodimost/

[18] Почему компании используют виртуальные машины, а не контейнеры: https://iaas-blog.it-grad.ru/tendencii/pochemu-korporativnye-zakazchiki-ispolzuyut-virtualnye-mashiny-a-ne-kontejnery/

[19] ИТ-архитектура будущего — кто и как к ней готовится: https://t.me/iaasblog/187

[20] Узнать за 60 секунд: что такое конвергентная и гиперконвергентная инфраструктура: https://t.me/iaasblog/196

[21] Защита данных в облаке: необычные сценарии: https://t.me/iaasblog/199

[22] Источник: https://habr.com/ru/post/442788/?utm_source=habrahabr&utm_medium=rss&utm_campaign=442788