Cisco раскрыли особенности работы 400-гигабитного NPU

На выставке Hot Chips, прошедшей ^[1] в августе этого года, ведущий инженер компании Cisco Джейме Маркевич (Jamie Markevitch) рассказал об особенностях работы сетевого процессора c производительностью 400 Гб/с, который в настоящее время поставляется клиентам.

^[2]
/ Flickr / Timothy Lorens ^[3] / CC ^[4]

Чип выполнен по 22-нанометровому техпроцессу и имеет 672 ядра, каждое из которых обрабатывает до четырех потоков. Сетевой процессор (NPU) содержит 9,2 миллиарда транзисторов и 353 Мб памяти SRAM. SRAM играет роль кеша L0, в котором хранятся инструкции и данные для каждого потока. Также имеется кеш L1 для кластера из 16 ядер.

NPU обладает 42 кластерами ядер, которые соединены с кешем инструкций L2 за счет командного кеша L2. Он также объединяет кеши разных уровней, хранилище пакетов данных, ускорители, встроенную и динамическую память в единую «сеть». Эта сеть работает на частоте 1 ГГц и имеет пропускную способность более 9 Тб/с.

Cisco раскрыли особенности работы 400-гигабитного NPU - 2

Блок-диаграмма чипа

Cisco не рассказали о наборе инструкций, который используется в NPU. Однако эксперты сделали предположение ^[5], что это кастомный набор, разработанный специально для работы с сетью, а не ARM, MIPS, Power или X86.

Потоки ядер NPU обеспечивают обработку пакета данных на протяжении всей его «жизни» в чипе. Это исключает простаивание или «жонглирование» пакетами между ядрами. Поэтому одновременно могут обрабатываться 2688 пакетов. Пакеты хранятся off-chip в DRAM, но обрабатываются в реальном времени в SRAM. Причём ускорители могут обращаться к DRAM-копии независимо от ядер, которые работают с SRAM-оригиналом.

Так как разные пакеты требуют разных характеристик, все ядра различаются по производительности, чтобы обеспечить максимальную эффективность. При этом Cisco NPU поддерживает привычные методы программирования — C или ассемблер.

Сетевой процессор обрабатывает пакеты на скорости 800 Гб/c, или 400 Гбит/с в полнодуплексном режиме. В свою очередь, пропускная способность интерфейса SERDES составляет 6,5 Тб/с. Большая часть соединений используется для подключения DRAM и TCAM — последняя хранит списки доступа (ACL). Она также используется для буферизации пакетов, поэтому ее иногда не хватает — тогда часть данных уходит на хранение в DRAM.

Большая часть логики NPU работает на частоте 760 МГц или 1 ГГц. Интерфейсы MAC поддерживают работу портов на скорости от 10 до 100 Гб/с.

Сетевой процессор оснащается интегрированным трафик-менеджером, который управляет 256 тыс. запросов одновременно и выдерживает нагрузку в полтриллиона объектов. Ускорители берут на себя обработку префиксов IPv4 и IPv6, сжатие и хеширование диапазонов IP, доставку пакетов, сбор статистики.

Внешняя память DRAM обладает 28 линиями SERDES, которые работают на скорости 12,5 Гб/с. SERDES использует проприетарный последовательный протокол для доступа к памяти — он способен проводить до миллиарда случайных обращений в секунду и поддерживает передачу данных на скорости до 300 Гб/с.

Логика связана с DRAM через параллельный интерфейс ввода/вывода — он обладает максимальной скоростью 1250 Мб/с. Интересно, что по 22-нанометровому техпроцессу выполнен только процессор. DRAM выполнена по техпроцессу 30 нм, а SERDES и BIST — по 28 нм.

«Мы определили, какие операции обычно проводят на такого рода устройствах, и оптимизировали чип для работы со случайными операциями на высокой скорости. Его можно использовать как буфер, в котором количество чтений будет равно количеству записей, а также для поиска данных по базам, когда количество обновлений не такое большое», — рассказал Джейми Маркевич (Jamie Markevitch), главный инженер Cisco.

Демонстрация «внутренностей» сетевого процессора — явление не уникальное, но редкое. Производители обычно такую информацию не разглашают, хотя исключения случаются. В январе компания Barefoot Networks рассказала ^[6] об особенностях чипа Tofino, Innovium в марте — о Teralynx ^[7] и Mellanox Technologies в июле — о Spectrum-2 ^[8].

О конференции Hot Chips

Hot Chips ^[9] — это симпозиум на тему высокопроизводительных процессоров. Впервые он состоялся еще в 1989 году. В этом году, помимо Cisco, мероприятие посетили многие крупные производители. В частности, Microsoft представили ^[10] свои наработки в области дополненной реальности и рассказали ^[11] о процессоре для Xbox One X Scorpio. Выступление китайской компании Baidu было посвящено ^[12] дополненной реальности, а представитель Google рассказал ^[13] об оптимизации железа для нейросетей.

P.S. О чем еще мы пишем в нашем блоге:

Автор: ИТ-ГРАДовец

Источник ^[17]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/cisco/264504

Ссылки в тексте:

[1] прошедшей: https://www.hotchips.org/archives/2010s/public-hc29/

[2] Image: https://habrahabr.ru/company/it-grad/blog/338620/

[3] Timothy Lorens: https://www.flickr.com/photos/icebrkr/6030707181/

[4] CC: https://creativecommons.org/licenses/by/2.0/

[5] предположение: https://www.nextplatform.com/2017/09/14/rare-peek-inside-400g-cisco-network-chip/

[6] рассказала: https://www.nextplatform.com/2017/01/30/hyperscalers-ready-run-barefoot-datacenter/

[7] о Teralynx: https://www.nextplatform.com/2017/03/21/upstart-switch-chip-maker-tears-ethernet-roadmap/

[8] Spectrum-2: https://www.nextplatform.com/2017/07/10/ethernet-getting-back-moores-law-track/

[9] Hot Chips: https://www.hotchips.org/

[10] представили: http://www.technewsworld.com/story/84762.html

[11] рассказали: http://www.tomshardware.com/news/xbox-scorpio-engine-soc-details,35282.html

[12] посвящено: https://www.nextplatform.com/2017/08/22/first-look-baidus-custom-ai-analytics-processor/

[13] рассказал: http://www.eetimes.com/document.asp?doc_id=1332185

[14] Защита персональных данных: европейский подход: http://iaas-blog.it-grad.ru/tendencii/zashhita-personalnyx-dannyx-evropejskij-podxod/

[15] Виртуализация приложений: как правильно настраивать виртуальные машины: http://iaas-blog.it-grad.ru/funkcionalnost/virtualizaciya-prilozhenij-kak-pravilno-nastraivat-virtualnye-mashiny/

[16] Особенности двухфакторной аутентификации: работает ли это в облаке IaaS: http://iaas-blog.it-grad.ru/bezopasnost/osobennosti-dvuxfaktornoj-autentifikacii/

[17] Источник: https://habrahabr.ru/post/338620/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best

Нажмите здесь для печати.