- PVSM.RU - https://www.pvsm.ru -
Большое обновление пакета Intel® Parallel Studio XE вышло на этой неделе. Версия 2016 включает три совершенно новых продукта:
Бета-версия доступна публично и бесплатно, программа длится до 23 июня, но лицензии будут работать вплоть до 25 сентября 2015 г. Для получения Бета-версии нужно зарегистрироваться здесь [1].
Эта статья посвящена обзору нового функционала, более детально отдельные продукты постараемся осветить в последующих блогах – пишите в комментариях, к чему есть интерес.
Intel® Advisor XE традиционно был инструментом прототипирования [2] параллелизма на потоках. В версии 2016 Beta он фактически разделяется на два больших продукта:
Основные возможности Vectorization Advisor:
Мы ещё напишем подробнее о Vectorization Advisor в следующих блогах.
Оптимизированная библиотека для работы с «большими данными» на разных стадиях: получение данных от источника, предварительная обработка, трансформация, интеллектуальный анализ данных, моделирование, валидация и принятие решений.
Официальное название — Intel® Parallel Studio XE 2016 Beta, Composer Edition. Продукт объединяет в себе компилятор и библиотеки. Компилятор Intel расширяет набор поддерживаемых стандартов:
OpenMP* 4.0:
simdlen
and safelen
для циклов, collapse(N)
для omp simd
.OpenMP* 4.1 TR 3:
omp target [enter | exit ] data
nowait
опцией для omp task
depend
для omp task
always
и delete
для map
С/С++ стандарты:
_Alignas, _Alighof, _Static_assert, _Thread_local, _Noreturn
, и _Generic
.
Fortran компилятор стал поддерживать подмодули (submodules), улучшена рантайм проверка неинициализированных переменных (опция [Q]init
), добавлена поддержка IMPURE ELEMENTAL (F2008) и улучшена C Interoperability (F2015).
В новой версии VTune™ Amplifier XE расширен функционал профилировки OpenMP и MPI приложений. Для OpenMP инструмент выдаёт статистику по параллельным регионам и подсвечивает те из них, где есть наибольший потенциал для оптимизации. VTune Amplifier распознаёт основные причины неэффективности OpenMP – дисбаланс нагрузки, накладные расходы, синхронизацию и др. Подробно об OpenMP анализе уже писалось [3].
VTune Amplifier сильно расширил возможности профилировки MPI-приложений, а самое интересное – гибридных, MPI+OpenMP. Т.е. вы можете одновременно анализировать дисбалансы OpenMP и MPI коммуникацию.
В таблице Bottom-up можно группироваться по MPI процессу и OpenMP регионам внутри него, а также по отдельным барьерам (например, у циклов) внутри региона:
Анализ производительности OpenCL программ, выполняющихся на Intel® HD Graphics, становится удобнее с новой «диаграммой архитектуры», где можно наглядно видеть аппаратные блоки GPU и их загрузку – занятость вычислительных ядер и трафик данных:
Другие изменения в VTune Amplifier XE:
-use-app-topology
позволяет Hydra подстраивать расстановку MPI процессов, основываясь на ранее собранной статистике и известной топологии кластера. --fast
для mpitune
позволяет ускорить автоматическую настройку благодаря использованию результатов предыдущего запуска.--rank-placement
для mpitune
оптимизирует настройку MPI под конкретную топологию кластера, основываясь на шаблонах коммуникации.
Новая опция -gtool
позволяет удобно запускать инструмент-анализатор для вашего MPI приложения. Например, Vectorization Advisor для анализа векторизации:
mpirun -n 4 -gtool "advixe-cl -collect survey:2,3" ./your_app
Или VTune Amplifier, для анализа производительности отдельных ранков:
mpirun -n 4 -gtool "amplxe-cl -collect hostpots:2,3" ./your_app
Обратите внимание, в примере анализ запускается лишь на ранках 2 и 3 из четырёх запущенных. Т.е. вы можете выборочно профилировать отдельные процессы.
Главным нововведением является MPI Performance Snapshot. Инструмент используется для быстрой верхнеуровневой оценки производительности – как приложение масштабируется, каков баланс загрузки MPI, OpenMP и вычислений.
Улучшен анализ гибридных приложений: Intel® Trace Analyzer позволяет выбрать MPI ранки и сгенерировать для них командную строку VTune™ Amplifier с помощью новой опции <code-gtool из Intel® MPI Library. Т.е. вы сначала определяете проблемные MPI процессы с Intel® Trace Analyzer, а потом изучаете их детально с VTune™ Amplifier.
Intel® Parallel Studio 2016 Beta несёт серьёзный набор нового функционала по целому ряду направлений:
Часть из этого есть развитие традиционного набора для HPC разработчика, но многое расширяется и на другие сферы, такие как мультимедиа и анализ данных.
Это был краткий обзор, в следующих постах напишем подробнее – дайте знать, что интересно в первую очередь.
Зарегистрироваться на Intel® Parallel Studio XE 2016 Beta [1].
Автор: krogozh
Источник [4]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/programmirovanie/88444
Ссылки в тексте:
[1] зарегистрироваться здесь: https://softwareproductsurvey.intel.com/f/150460/2f82/
[2] инструментом прототипирования: http://habrahabr.ru/company/intel/blog/152086/
[3] уже писалось: http://habrahabr.ru/company/intel/blog/248979/
[4] Источник: http://habrahabr.ru/post/255175/
Нажмите здесь для печати.