Рубрика «параллельное программирование» - 27

Параллельное программирование с CUDA. Часть 2: Аппаратное обеспечение GPU и шаблоны параллельной коммуникации

2014-12-10 в 15:15, admin, рубрики: CUDA, gpgpu, Udacity, Блог компании EPAM Systems, параллельное программирование

Содержание

Часть 1: Введение.
Часть 2: Аппаратное обеспечение GPU и шаблоны параллельной коммуникации.
Часть 3: Фундаментальные алгоритмы GPU: свертка (reduce), сканирование (scan) и гистограмма (histogram).
Часть 4: Фундаментальные алгоритмы GPU: уплотнение (compact), сегментированное сканирование (segmented scan), сортировка. Практическое применение некоторых алгоритмов.
Часть 5: Оптимизация GPU программ.
Часть 6: Примеры параллелизации последовательных алгоритмов.
Часть 7: Дополнительные темы параллельного программирования, динамический параллелизм.
Читать полностью »

Параллельное программирование с CUDA. Часть 1: Введение

2014-12-10 в 12:22, admin, рубрики: CUDA, gpgpu, Udacity, Блог компании EPAM Systems, параллельное программирование

Еще одна статья о CUDA — зачем?

На Хабре было уже немало хороших статей по CUDA — раз, два и другие. Однако, поиск комбинации «CUDA scan» выдал всего 2 статьи никак не связанные с, собственно, алгоритмом scan на GPU — а это один из самых базовых алгоритмов. Поэтому, вдохновившись только что просмотренным курсом на Udacity — Intro to Parallel Programming, я и решился написать более полную серию статей о CUDA. Сразу скажу, что серия будет основываться именно на этом курсе, и если у вас есть время — намного полезнее будет пройти его.
Читать полностью »

Lock-free структуры данных. Диссекция очереди

2014-12-09 в 7:00, admin, рубрики: c++, lock-free, queue, параллельное программирование, Программирование

Lock-free структуры данных. Диссекция очереди - 1
Со времени предыдущего поста из жизни lock-free контейнеров прошло немало времени. Я рассчитывал быстро написать продолжение трактата об очередях, но вышла заминка: о чем писать, я знал, но реализации на C++ этих подходов у меня не было. «Не годится писать о том, что сам не попробовал», — подумал я, и в результате я попытался реализовать в libcds новые алгоритмы очередей.
Сейчас настал момент, когда я могу аргументированно продолжить свой цикл. В данной статье закончим с очередями.

Кратко напомню, на чем я остановился. Были рассмотрены несколько интересных алгоритмов lock-free очередей, а под занавес приведены результаты их работы на некоторых синтетических тестах. Главный вывод — всё плохо! Надежды на то, что lock-free подход на магическом compare-and-swap (CAS) даст нам пусть не линейный, но хотя бы какой-то рост производительности с увеличением числа потоков, не оправдались. Очереди не масштабируются. В чем причина?..
Читать полностью »

Атомарные и неатомарные операции

2014-12-03 в 9:31, admin, рубрики: c++, c++11, std::atomic, многопоточное программирование, параллельное программирование, перевод

Атомарные и неатомарные операции - 1

В Сети уже очень много написано об атомарных операциях, но в основном авторы рассматривают операции чтения-модификации-записи. Однако, существуют и другие атомарные операции, например, атомарные операции загрузки (load) и сохранения (store), которые не менее важны. В этой статье я сравню атомарные загрузки и сохранения с их неатомарными аналогами на уровне процессора и компилятора C/C++. По ходу статьи мы также разберемся с концепцией «состояния гонок» с точки зрения стандарта C++11.
Читать полностью »

Процессоры, ядра и потоки. Топология систем

2014-11-25 в 6:07, admin, рубрики: apic, apicid, cpu topology, cpuid, logical processor, multicore, multithreading, Блог компании Intel, параллельное программирование, системное программирование

В этой статье я попытаюсь описать терминологию, используемую для описания систем, способных исполнять несколько программ параллельно, то есть многоядерных, многопроцессорных, многопоточных. Разные виды параллелизма в ЦПУ IA-32 появлялись в разное время и в несколько непоследовательном порядке. Во всём этом довольно легко запутаться, особенно учитывая, что операционные системы заботливо прячут детали от не слишком искушённых прикладных программ.

Процессоры, ядра и потоки. Топология систем - 1

Используемая далее терминология используется в документации процессорам Intel. Другие архитектуры могут иметь другие названия для похожих понятий. Там, где они мне известны, я буду их упоминать.

Цель статьи — показать, что при всём многообразии возможных конфигураций многопроцессорных, многоядерных и многопоточных систем для программ, исполняющихся на них, создаются возможности как для абстракции (игнорирования различий), так и для учёта специфики (возможность программно узнать конфигурацию).
Читать полностью »

Семафоры, или как разруливать доступ к ресурсам в DBMS Caché

2014-11-17 в 8:05, admin, рубрики: cache, cache object script, dbms, dbms cache, intersystems cache, Блог компании InterSystems, доступ к объектам, общий доступ, параллельное программирование, Программирование, семафоры

Часто при многопользовательском или параллельном доступе к данным возникает ситуация, когда необходимо заблокировать/дать доступ к переменной или участку памяти одновременно нескольким процессам. Решается данная задача с помощью мьютексов, семафоров, мониторов и т. д. В данном посте рассмотрим как же реализован один из методов предоставления совместного доступа к данным — семафор — в СУБД Intersystems Caché.
Семафоры, или как разруливать доступ к ресурсам в DBMS Caché - 1
Читать полностью »

Python реализация парадигмы event-driven с помощью сопрограмм

2014-11-14 в 11:23, admin, рубрики: coroutine, event loop, event-driven programming, python, tornado, yield from, Алгоритмы, параллельное программирование, паттерны проектирования, событийное программирование

Статья про то, как с помощью расширенных генераторов Python сделать собственную реализацию сопрограмм, переключающихся по получению событий. Простота кода получившегося модуля вас приятно удивит и прояснит новые и мало используемые возможности языка, которые можно получить, используя такие генераторы. Статья поможет разобраться и с тем, как это устроено в серьезных реализациях: asyncio, tornado, etc.
Читать полностью »

Фракталы, Fortran и OpenMP

2014-11-03 в 8:56, admin, рубрики: fortran, параллельное программирование, Программирование, фракталы

Когда-то давно я решил «потрогать» Fortran. Единственную задачу которую я придумал — генерация фракталов (заодно и OpenMP в Fortran'е можно было бы попробовать). В процессе написания я часто сталкивался с проблемами, решение которых приходилось додумывать самому (например в интернете не так много примеров использования чисел двойной точности или бинарной записи в файл). Но рано или поздно все проблемы решились, и я хочу написать этот текст, который возможно кому-нибудь поможет.

Писать я буду на диалекте Fortran 90, но с GNU расширениями (те же числа двойной точности).
Читать полностью »

AsyncCollections: история одного велосипеда

2014-10-20 в 6:04, admin, рубрики: .net, async, await, Interlocked, MemoryBarrier, volatile, асинхронные коллекции, магия, параллельное программирование

С давних времён я был большим поклонником System.Collections.Concurrent и BlockingCollection в особенности. Сколько раз это чудо инженерной мысли выручало в самых разнообразнейших ситуациях — не счесть.

С чуть менее древних времён в обиход прочно вошли async/await. Казалось бы, жизнь прекрасна, но есть одно «но»: асинхронный код миксовать с блокирующим кодом как-то не очень-то хочется. А BlockingCollection, как несложно догадаться (хотя бы из названия), в ряде случаев поток блокирует.
Читать полностью »

Асинхронность 2: телепортация сквозь порталы

2014-10-16 в 9:54, admin, рубрики: c++, асинхронность, Блог компании Яндекс, Десятое королевство, параллельное программирование, Программирование

Не прошло и года, как я добрался до продолжения статьи про асинхронность. Эта статья развивает идеи той, самой первой статьи про асинхронность [1]. В ней обсуждается достаточно сложная задача, на примере которой будет раскрыта мощь и гибкость использования сопрограмм в различных нетривиальных сценариях. В заключение будут рассмотрены две задачи на состояние гонки (race-condition), а также небольшой, но очень приятный бонус.
Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «параллельное программирование» - 27

Параллельное программирование с CUDA. Часть 2: Аппаратное обеспечение GPU и шаблоны параллельной коммуникации

Содержание

Параллельное программирование с CUDA. Часть 1: Введение

Еще одна статья о CUDA — зачем?

Lock-free структуры данных. Диссекция очереди

Атомарные и неатомарные операции

Процессоры, ядра и потоки. Топология систем

Семафоры, или как разруливать доступ к ресурсам в DBMS Caché

Python реализация парадигмы event-driven с помощью сопрограмм

Фракталы, Fortran и OpenMP

AsyncCollections: история одного велосипеда

Асинхронность 2: телепортация сквозь порталы

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «параллельное программирование» - 27

Содержание

Еще одна статья о CUDA — зачем?

Новости

Актуальные темы

Архив