Рубрика «параллельное программирование» - 30

Будущее программирования аппаратных ускорителей

2014-01-23 в 21:35, admin, рубрики: CUDA, gpgpu, opencl, высокая производительность, параллельное программирование, метки: CUDA, gpgpu, opencl

Многие из новейших суперкомпьютеров основаны на аппаратных ускорителях вычислений (accelerator). включая две самые быстрые системы согласно TOP500 от 11/2013. Ускорители распространяются так же и на обычных PC и даже появляются в портативных устройствах, что ещё больше способствовует росту интереса к программированию ускорителей.

Такое широкое применение ускорителей является результатом их высокой производительности, энергоэффективности и низкой стоимости. Например, если сравнить Xeon E5-2687W и GTX 680, выпущенные в марте 2012, мы увидим, что GTX 680 в четыре раза дешевле, имеет в 8 раз большую производительность операций одинарной точности и в 4 раза большую пропускную способность памяти, а так же обеспечивает более 30 раз большую производительность в пересчёте на доллар и в 6 раз большую производительность на ватт. Исходя из таких сравнительных результатов, ускорители должны бы использоваться везде и всегда. Почему же этого не происходит?
Читать полностью »

Вышел Rust 0.9

2014-01-10 в 11:56, admin, рубрики: Rust, параллельное программирование, Программирование, системное программирование, метки: Rust, Программирование

Вышел Rust 0.9
Mozilla выпустила новую версию компилятора Rust 0.9 и соответствующих инструментов.

Rust — это компилируемый и мультипарадигмальный язык для системного программирования, который позиционируется как альтернатива С/С++. Визуально он похож на C, но отличается в деталях синтаксиса и семантики. Идеально подходит для параллельных вычислений.

Разработчики говорят о существенном улучшении рантайма и подсистемы ввода-вывода. Так, в компиляторе появились статические ссылки и поддерживается оптимизация во время линковки (link-time). В языке уменьшено количество разных видов замыканий, чтобы упростить и сделать более логичным синтаксис.
Читать полностью »

Введение в параллельные вычисления в R

2013-12-21 в 19:30, admin, рубрики: анализ данных, Параллелизм, параллельное программирование, метки: анализ данных, Параллелизм

Введение в параллельные вычисления в R Эта статья посвящена языку R. Он не так широко распространен на территории ex-USSR, как Matlab и тем более Python, но, безусловно, заслуживает внимания. Нельзя не отметить, что R — фактически стандарт для Data Science (хотя тут хорошо написано, что не R единым живут data scientists). Богатый синтаксис, совместимость с legacy кодом (что весьма важно в научных приложениях), удобная среда разработки RStudio и наличие огромного числа библиотек в CRAN делают R таковым.
Читать полностью »

Разработчик на распутье: как векторизовать?!

2013-12-16 в 7:01, admin, рубрики: Блог компании Intel, векторизация, параллельное программирование, Программирование, метки: векторизация

На тему векторизации написано немало интересного. Вот скажем, отличный пост, который много полезного объясняет по работе автовекторизации, очень рекомендовал бы его к прочтению. Мне интересен другой вопрос. Сейчас в руках у разработчиков большое количество способов, чтобы создать «векторный» код – от чистого ассемблера до того же автовекторизатора. На каком же способе остановиться? Как найти баланс между необходимым и достаточным? Об этом и поговорим.
Читать полностью »

Поговорим про Intel® Clik™ Plus

2013-12-11 в 5:45, admin, рубрики: Блог компании Intel, параллельное программирование, Программирование, метки: параллельное программирование

Мой недавний пост про OpenMP 4.0 натолкнул меня на мысль, что было бы неплохо написать и про Intel® Cilk™ Plus, потому что модель программирования весьма интересная и уж точно заслуживает отдельного внимания. Ну и раз её часть стала фактически новым стандартом OpenMP, то, вероятно, были на то веские причины.
Читать полностью »

Обработка событий в реальном масштабе времени с помощью SynapseGrid

2013-12-05 в 13:19, admin, рубрики: scala, Блог компании Праймтолк, параллельное программирование, реактивное программирование, функциональное программирование, метки: scala, параллельное программирование, реактивное программирование, функциональное программирование

Занимались мы как-то обработкой аудио на Java с помощью сложных алгоритмов. Каждый кусочек аудио должен был пройти длинную цепочку обработки (20-50 алгоритмов разной степени сложности). Потоки аудио поступали параллельно, алгоритмы работали параллельно, и завершались в разные моменты. Некоторые алгоритмы нуждались в разной степени буферизации. Из кусочков аудио извлекалась информация повышающегося уровня абстракции, то есть начиная с какого-то уровня уже шло не аудио, а извлечённая информация об этом аудио.

Всё хозяйство должно было работать в рамках одного экземпляра приложения, но при этом должно было быть несколько вложенных почти независимых очень похожих контейнеров для клиентского кода (типа Bean'ов).

С самого начала мы не ставили задачу всеобщей унификации, и решали в каждой части системы по своему. Где-то использовали потоки для длительных задач, где-то создавали цепочки вызовов, где-то — модель подписки. Так как система была довольно большой, то практически все известные способы декомпозиции и обработки были задействованы в той или иной степени. Потом мы обнаруживали общность и реализовывали похожие решения в разных частях системы. А потом изобрели первую версию того, что сейчас мы называем система контактов или SynapseGrid.
Читать полностью »

Оптимизация приложений под Android x86: проверенные способы

2013-12-05 в 7:28, admin, рубрики: atom, sse, Блог компании Intel, параллельное программирование, Разработка под android, метки: atom, sse

Оптимизация приложений под Android x86: проверенные способы
Любое приложение для Android, даже написанное только на скриптовых языках (таких как Java или HTML5), в конечном счёте использует базисные компоненты среды исполнения, которые должны быть оптимизированы. Хорошими примерами для иллюстрации оптимизационных подходов и потребностей являются приложения, использующие технологии мультимедиа и дополненной реальности, описанные ниже. Для платформы Android (смартфоны и планшеты) Intel использует различные виды процессоров Atom, имеющих SSSE3 уровень векторизации и обычно 2 ядра с гипертредингом – считайте это намеком :) Для тех, кто намек понял, под катом – история оптимизации и распараллеливания одного конкретного приложения израильской компании iOnRoad — iOnRoad.
Читать полностью »

Ждали, ждали и дождались! OpenMP 4.0

2013-12-04 в 8:22, admin, рубрики: openmp, Блог компании Intel, Компиляторы, параллельное программирование, метки: openmp, параллельное программирование

Каждая новая спецификация OpenMP вводит очень полезные и необходимые дополнения к уже существующему функционалу. Например, в версии 3.0 были добавлены так ожидаемые задачи (tasks), позволившие решать ещё больший спектр задач по распараллеливанию приложений. В 3.1 целый ряд улучшений по работе с задачами и редукциями.

Но по сравнению с тем, что нам теперь даёт стандарт 4.0, предыдущие нововведения кажутся какими-то мелкими. Последняя версия расширила типы поддерживаемого параллелизма, чего раньше никогда не замечалось.
Читать полностью »

Microsoft Robotics. Параллельная обработка данных

2013-12-02 в 14:28, admin, рубрики: .net, microsoft, microsoft robotics developer studio, параллельное программирование, параллельные вычисления, метки: .net, c++, DEV3, microsoft robotics developer studio, параллельные вычисления

Один из продуктов Microsoft — Microsoft Robotics включает библиотеку Concurrent and Coordination Runtime. Библиотека очень нужна роботам для организации параллельных вычислений при обработке звука и изображений (да и не только их). В посте я расскажу как с помощью данной библиотеки создать параллельный алгоритм умножения матрицы A (m × n элементов) на вектор B (1 × n элементов) по следующей формуле: Microsoft Robotics. Параллельная обработка данных . Алгоритм вычисления вектора C (m × 1 элементов) легко распараллеливается, так как значение i-го элемента вектора не зависит от значений других его элементов. Перед запуском примера из исходников рекомендуется установить Microsoft Robotics.
Читать полностью »

Профилировка производительности OpenMP приложений

2013-12-02 в 5:24, admin, рубрики: VTune Amplifier XE, Блог компании Intel, высокая производительность, параллельное программирование, метки: VTune Amplifier XE

Профилировка производительности OpenMP приложений

OpenMP – пожалуй, самая распространённая модель параллельного программирования на потоках, на системах с общей памятью. Ценят её за высокоуровневые параллельные конструкции (в сравнении с программированием системных потоков) и поддержку разными производителями компиляторов. Но этот пост не про сам стандарт OpenMP, про него есть много материалов в сети.

Распараллеливают вычисления на OpenMP ради производительности, о чём, собственно, и статья. Точнее, об измерении производительности с помощью Intel VTune Amplifier XE. А именно, как получить информацию о:

Получении профиля всего OpenMP приложения
Профиле отдельных параллельных регионов OpenMP (время CPU, горячие функции и т.д.)
Балансе работы внутри отдельного параллельного региона OpenMP
Балансе параллельного/последовательного кода
Уровне гранулярности параллельных задач
Объектах синхронизации, времени ожидания и передачах управления между потоками

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «параллельное программирование» - 30

Будущее программирования аппаратных ускорителей

Вышел Rust 0.9

Введение в параллельные вычисления в R

Разработчик на распутье: как векторизовать?!

Поговорим про Intel® Clik™ Plus

Обработка событий в реальном масштабе времени с помощью SynapseGrid

Оптимизация приложений под Android x86: проверенные способы

Ждали, ждали и дождались! OpenMP 4.0

Microsoft Robotics. Параллельная обработка данных

Профилировка производительности OpenMP приложений