Рубрика «высокая производительность» - 110

Применение FPGA для расчета деполимеризации микротрубочки методом броуновской динамики

2016-11-21 в 13:19, admin, рубрики: fpga, gpgpu, HLS, HPC, высокая производительность, параллельное программирование

Все готово, чтобы рассказать Хабр аудитории о применении FPGA в сфере научных высокопроизводительных вычислений. И о том, как на данной задаче надо удалось значительно обскакать GPU (Nvidia K40) не только в метрике производительность на ватт, но и просто с точки зрения скорости вычисления. В качестве FPGA платформы использовался кристалл Xilinx Virtex-7 2000t, подключенный по PCIe к хост компьютеру. Для создания аппаратного вычислительного ядра использовался язык C++ (Vivado HLS).

Под катом текст нашей оригинальной статьи. Там, как обычно бывает, сначала идет долгое описание зачем это все надо и модели, если нет желания это читать, то можно переходить сразу к реализации, а модель посмотреть потом при необходимости. С другой стороны без хотя бы беглого ознакомления с моделью читатель не сможет получить впечатление о том, какие сложные вычисления можно реализовать на FPGA )

Читать полностью »

Однажды встретились JMeter и незнакомка…

2016-11-20 в 0:26, admin, рубрики: groovy, http, java, jmeter, jni, jupyter, pandas, wget, балансировка нагрузки, высокая производительность, плагин, Тестирование IT-систем, Тестирование веб-сервисов

Однажды встретились JMeter и незнакомка… - 1
Кадр из фильма «Дом у озера». Встреча (www.kinopoisk.ru)

Джим ещё не знал, как подойти к ней, с чего начать разговор и на каком языке его вести. Но он видел многое, владел языками и имел в рукаве не один козырь. И будучи уверенным в помощи верных друзей (это мы с вами) и забыв про сомнения, шёл на встречу судьбе.

Ниже рассказ о том, как Джим завоёвывал снова и снова сердце незнакомой системы. Не подумайте, что незнакомок было несколько. Она была одна, единственная, но такая разная, и от того истории будут следовать одна за другой.
Читать полностью »

Оптимизация нейросетевой платформы Caffe для архитектуры Intel

2016-11-18 в 11:00, admin, рубрики: Intel AVX, Intel MKL, Intel Modern Code, intel xeon, openmp, Блог компании Intel, векторизация, высокая производительность, машинное обучение, оптимизация, параллельные вычисления, метки: Intel Modern Code

Современные программы, претендующие на звание эффективных, должны учитывать особенности аппаратного обеспечения, на котором они будут исполняться. В частности, речь идёт о многоядерных процессорах, например, таких, как Intel Xeon и Intel Xeon Phi, о больших размерах кэш-памяти, о наборах инструкций, скажем, Intel AVX2 и Intel AVX-512, позволяющих повысить производительность вычислений.

Еле удержались, чтобы не пошутить про руссиано)

Вот, например, Caffe – популярная платформа для разработки нейронных сетей глубокого обучения. Её создали в Berkley Vision and Learning Center (BVLC), она пришлась по душе сообществу независимых разработчиков, которые вносят посильный вклад в её развитие. Платформа живёт и развивается, доказательство тому – статистика на странице проекта в GitHub. Caffe называют «быстрой открытой платформой для глубокого обучения». Можно ли ускорить такой вот «быстрый» набор инструментов? Задавшись этим вопросом, мы решили оптимизировать Caffe для архитектуры Intel.
Читать полностью »

Наконец-то приличный отечественный процессор ЦОС – 1967BH28

2016-11-11 в 9:42, admin, рубрики: 1967BH28, ADSP-TS201S, dsp, fpga, высокая производительность, процессор, цос

Несмотря на стремительное развитие процессоров общего назначения (ARM, x86 и более экзотических), не теряют своей актуальности специализированные процессоры цифровой обработки сигналов (ЦОС). Одним из самых популярных процессоров ЦОС с плавающей точкой в родном отечестве стал процессор ADSP-TS201S фирмы Analog Devices. В свое время (10-15 лет назад) этот процессор не знал себе равных в высокопроизводительных системах ЦОС, работающих в реальном времени. Его основные характеристики:

Частота процессора – 600 MГц
Объем внутренней памяти – 3 МБайта
4 высокоскоростных порта – 600 Мбайт/сек
Внешняя шина – 100 МГц
Каналы DMA – 12 каналов

Решения на процессоре ADSP-TS201S хорошо себя зарекомендовали в широком классе аппаратуры как гражданского, так и не очень гражданского назначения. Но всему хорошему приходит ~~сами знаете что~~ конец.
Читать полностью »

Можно скачать материалы семинара Nanometer ASIC (РОСНАНО – МИСиС – Imagination Technologies) — ликбез по всему про чипы

2016-11-10 в 9:21, admin, рубрики: fpga, imagination technologies, Nanometer ASIC, Synopsys IC Compiler, Байкал электроникс, высокая производительность, МИСиС, МИЭМ, НИИСИ, ПЛИС, программирование микроконтроллеров, Разработка для интернета вещей, РОСНАНО, элвис-неотек, метки: Nanometer ASIC

Господа! Семинар Nanometer ASIC, организованный РОСНАНО, МИСиС и Imagination Technologies, оказался довольно популярным — на него зарегистрировались более 180 человек, пришли 127, причем в аудитории засветились предствители всех значимых российских микроэлектронных проектов — от радиационно-стойких микросхем для космоса из НИИСИ до чипов для умных камер от ЭЛВИС-НеоТек, инженеров из Байкал Электроникс, руководителей проектов по автоматизации проектирования микросхем из МГУ, разработчики российских ПЛИС-ов из Воронежа, преподаватели из ВШЭ/МИЭМ и других вузов, организаторов олимпиад для школьников из МФТИ и многие другие.

Несмотря на то, что для профессиональных спецов по использованию Synopsys IC Compiler семинар был слишком элементарный, но его вводный характер искупился его широтой — инженеры из всей цепочки проектирования и производства могли освежить в памяти области, которые они забыли, инвесторы в полупроводниковой индустрии смогли посмотреть что делают компании, в которые они инвестируют, студенты посмотрели, что им может нравится и так сказать куда копать (в полупроводниковой индустрии Silicon Valley молодые инженеры специализируются в логический / физический / аналоговый дизайн довольно рано в своей карьере).

Ведущий семинара, лектор Калифорнийского университета в Санта-Крус (отделение в Кремниевой долине) Чарльз Данчек (Charles Dancak) отвечает на вопросы:

Можно скачать материалы семинара Nanometer ASIC (РОСНАНО - МИСиС - Imagination Technologies) — ликбез по всему про чипы - 1

Скачать все слайды на русском можно здесь.

Под катом — избранные слайды Nanometer ASIC (25 из 322):
Читать полностью »

Анализируем производительность сервера Oracle SPARC T7-2

2016-11-09 в 12:39, admin, рубрики: dax, in-memory database, oracle, spark, Блог компании Инфосистемы Джет, высокая производительность, инфосистемы джет, Тестирование IT-систем

Одной из самых важных новостей компании Oracle в 2015 году стал выход нового процессора SPARC M7 и линейки серверов на его основе. В эту линейку вошли серверы T-серии (T7-1, T7-2, T7-4) и серверы M-серии (M7-8, M7-16).

Помимо уникальных физических характеристик (частота 4,13 гГц, 32 ядра, до 256 потоков) на процессоре M7 заявлена возможность переноса части SQL-логики базы данных Oracle на специальные сопроцессоры DAX (Data Analytics Accelerator). Эта технология получила название «SQL in Silicon» – с ней новый процессор M7 позиционируется как первый процессор в истории ИТ, в том числе оптимизированный под задачи Oracle Database.

В начале 2016 года стало возможно тестирование серверов T-серии, и мы одними из первых в России параллельно протестировали сразу два тестовых сервера T7-2 (по два процессора M7 в каждом).
Читать полностью »

NetApp ONTAP & ESXi 6.х tuning

2016-11-09 в 6:42, admin, рубрики: alua, cDOT, disk misalignment, ESXi, esxi 4, esxi 5, ESXi 6, fc, FCoE, FCP, fibrechannel, gos, HA, HBA, high availability, iscsi, jumbo frames, linux, loadbalancing, misalignment, mpio, mtu, NAS, NetApp, NetApp FAS, nfs, nfs4, nfsv4, ONTAP, ontap 9, RDM, SAN, Solaris, tuning, vaai, vasa, vcenter, vmfs, VMware, VMWare ESXi, vsc, vSphere 6, vVOL, wafl, windows, высокая производительность

В продолжение темы об оптимизации ESXi хоста для взаимодействия с СХД NetApp ONTAP, эта статья будет просвещена оптимизации производительности VMWare ESXi 6.X, предыдущие статьи были посвящены тюнингу ОС Linux, Windows и VMware ESXi 5.X в среде SAN. Компания NetApp давно тесно сотрудничает с VMware, подтверждением тому может стать тот факт, что нашумевшая технология vVOL была реализована одной из первых ещё в релизе Clustered Data ONTAP 8.2.1 (Август 2014), в то время как vSphere 6.0 ещё даже не был выпущен. Компания NetApp первой объявила поддержку vVol c NFS (Возможно NetApp по-прежнему здесь единственный, не слежу). В связи с чем системы хранения ONTAP крайне популярны в этом окружении.
Эта статья будет полезна владельцам систем хранения с ONTAP, а часть про Disk Alignment будет полезна не только владельцам NetApp`а.

Настройки VMWare ESXi 6.X можно разделить на следующие части:

Оптимизация гипервизора
Оптимизация гостевой ОС (GOS)
Оптимальные настройки SAN (FC/FCoE и iSCSI)
Настройки NAS (NFS)
Проверка совместимости оборудования, прошивок и ПО

NetApp ONTAP & ESXi 6.х tuning - 1
Для поиска узкого места обычно выполняют методику последовательного исключения. Предлагаю перво-наперво начать с СХД. А дальше двигаться СХД -> Сеть (Ethernet / FC) -> Хост ( Windows / Linux / VMware ESXi ) -> Приложение.
Читать полностью »

JRuby + Ratpack = ❤️

2016-11-09 в 3:50, admin, рубрики: java, jruby, ratpack, ruby, высокая производительность

JRuby + Ratpack = Love

Многие разработчики на Ruby знают как обстоят дела с асинхронным выполнением кода на имеющихся серверах.
Либо вы используете что-то на EventMachine, либо колдуете с Ruby::Concurrent, Celluloid.
В любом случае, это работает не сильно эффективно из-за GIL (ждем, надеемся и верим в Ruby 3).
Но есть реализации свободные от этой проблемы, одна из них поверх JVM — JRuby, где теже самые библиотеки будут чувствовать себя гораздо комфортней.
Много расписывать не буду, думаю все как минимум слышали про него.
Главной особенностью данной реализации является легкая интеграция с любой библиотекой на JVM.
Это открывает большой простор в выборе библиотек и готовых инструментов.

Читать полностью »

Текстовая трансляция HighLoad++ 2016. День второй

2016-11-08 в 7:31, admin, рубрики: Блог компании Конференции Олега Бунина (Онтико), высокая производительность, высоконагруженные проекты, высокопроизводительные вычисления, нагрузочное тестирование, Программирование, Проектирование и рефакторинг, Разработка для интернета вещей

Сегодня в этом посте весь день будет вестись текстовая трансляция конференции HighLoad++ 2016, проходящей в Сколково 8 ноября. HighLoad++ — это более 200 экспертов высочайшего класса с докладами о высоконагруженных сервисах, проблемах работы с ними и вопросах администрирования. Более 15 залов, плотный график, честный и полезный опыт спикеров — HighLoad++ умеет собирать крутые темы, задавать тон дискуссии и всё на одном дыхании.

Если вы хотите смотреть видео из главного зала и включения из мобильной студии Хабрахабра, то вам на страницу спецпроекта. Если почитать онлайн и поообщаться в кооментариях — под кат.

Текстовая трансляция HighLoad++ 2016. День второй - 1
Читать полностью »

TailSampler — паралельная отправка GET-запросов в Apache.JMeter

2016-11-01 в 22:21, admin, рубрики: java, jmeter, высокая производительность, плагин, Тестирование веб-сервисов

TailSampler — паралельная отправка GET-запросов в Apache.JMeter - 1

1. Назначение плагина «HTTP Request Tail»

Плагин упрощает загрузку встроенных ресурсов, позволяет параллельно выполнять указанные GET-запросы. Делая тест максимально близким к работе браузера по составу загружаемых ресурсов и по способу загрузки этих ресурсов.

TailSampler выручает если нужно:

выполнить группу GET-запросов паралельно;
выполнить 1000 GET-запросов, не создавая 1000 компонентов HTTP Request;
протестировать сайт, активно использующий AJAX, Adobe Flash, Adobe AIR, SilverLigth, ...

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «высокая производительность» - 110

Применение FPGA для расчета деполимеризации микротрубочки методом броуновской динамики

Однажды встретились JMeter и незнакомка…

Оптимизация нейросетевой платформы Caffe для архитектуры Intel

Наконец-то приличный отечественный процессор ЦОС – 1967BH28

Можно скачать материалы семинара Nanometer ASIC (РОСНАНО – МИСиС – Imagination Technologies) — ликбез по всему про чипы

Анализируем производительность сервера Oracle SPARC T7-2

NetApp ONTAP & ESXi 6.х tuning

JRuby + Ratpack = ❤️

JRuby + Ratpack = Love

Текстовая трансляция HighLoad++ 2016. День второй

TailSampler — паралельная отправка GET-запросов в Apache.JMeter

1. Назначение плагина «HTTP Request Tail»