Метка «gpu»

Аннотация

В данной статье хочу рассказать как можно эффективно распараллелить алгоритм BFS — поиск в ширину в графе с использованием графических ускорителей. В статье будет приведен подробный анализ полученного алгоритма. Вычисления выполнялись на одном GPU GTX Titan архитектуры Kepler.

Введение

В последнее время все большую роль играют графические ускорители (GPU) в не графических вычислениях. Потребность их использования обусловлена их относительно высокой производительностью и более низкой стоимостью. Как известно, на GPU хорошо решаются задачи на структурных сетках, где параллелизм так или иначе легко выделяется. Но есть задачи, которые требуют больших мощностей и используют неструктурные сетки. Примером такой задачи является Single Shortest Source Path problem (SSSP) – задача поиска кратчайших путей от заданной вершины до всех остальных во взвешенном графе. Решение данной задачи рассмотрено мной в этой статье. Вторым примером задачи на неструктурных сетках является задача Breadth First Search (BFS) — поиска в ширину в неориентированном графе. Данная задача является основной в ряде алгоритмов на графах. Также она немного проще, чем поиск кратчайшего пути. На данный момент алгоритм BFS используется как основной тест для рейтинга Graph500. Далее рассмотрим, как можно использовать идеи решения задачи SSSP в задаче BFS. Про архитектуру GPU компании Nvidia и об упомянутых алгоритмах уже много написано, поэтому в этой статье я не стану дополнительно писать про это. Так же, надеюсь, что понятия warp, cuda блок, SMX, и прочие базовые вещи, связанные с CUDA читателю знакомы.
Читать полностью »

Не так уж и давно стало популярным использовать видеокарты для вычислений. В один прекрасный день, несколько лет назад и я взглянул на новую, тогда, технологию CUDA. В руках была хорошая карточка по тем временам GTX8800, да и задачки для распараллеливания тоже были.
Кто работал с GPU, знает про объединение запросов, конфликт банков и как с этим бороться, а если не работал, то можно найти несколько полезных статей по основам программирования на CUDA[1]. Карта GTX8800, в некотором смысле, была хороша тем, что была одной из первых и поддерживала только первые версии CUDA, поэтому на ней было четко заметно, когда есть конфликты банков или запросы в глобальную память не объединяются, потому что время в этом случае увеличивалось в разы. Все это помогало лучше понять все правила работы с картой и писать нормальный код.
В новые модели добавляют все больше и больше функциональности, что облегчает и ускорят разработку. Появились атомарные операции, кеш, динамический параллелизм и т.д.
В посте я расскажу про пространственно-временную фильтрацию изображений и реализацию для compute capability = 1.0, и как можно ускорить получившийся результат за счет новых возможностей.
Временная фильтрация может пригодиться при наблюдении за спутниками или в прочих ситуациях фильтрации, когда требуется точное подавление фона.
Пространственно временная обработка изображений на GPU
Читать полностью »

Скоро для операции на сердце — не будет нужды его останавливать и вскрывать грудную клетку пациента. Операцию будет производить хирург с помощью манипуляторов, подведенных к сердцу через небольшие проколы в груди пациента. Микрокамеры в реальном времени оцифровывают бьющееся сердце, строя его трёхмерную модель, а специальные алгоритмы предсказывают следующее положение области интереса сердца, и манипулятор следует вслед за ней — хирург работает в сопровождающей системе координат, в которой сердце неподвижно. Такой огромный поток данных невозможно обработать на обычных процессорах, но по словам разработчиков — производительности Читать полностью »

3D ускорение VDI на практике.

Часть 1 — vSGA и vDGA

3D ускорение VDI на практике

Отсутствие аппаратного ускорения графики является существенным препятствием при внедрении технологий виртуализации в компаниях, работающих в сфере дизайна, проектирования, конструкторских разработок и пр. Рассмотрим, какие новые возможности появились с выходом NVIDIA GRID.

Виртуализация рабочих мест (VDI) уже прочно вошла в нашу жизнь, в первую очередь в корпоративном сегменте рынка, и уверенно пробивает путь в остальные сегменты, в том числе и в виде публичных облачных сервисов (Desktop as a Service). Отсутствие же аппаратного ускорения графики сдерживает использование данной технологии в тех отраслях, которые могли бы оценить такие преимущества использования VDI как удаленную доступность, безопасность данных и упрощение аутсорсинга персонала.Читать полностью »

image
www.kickstarter.com/projects/725991125/open-source-graphics-processor-gpu
На Kickstarter несколько дней назад стартовал любопытный проект. Его цель — создать открытый [тут всякий бред маркетологов] и современный графический процессор. Под современностью автор подразумевает совместимость с OpenGL и D3D. Упоминается реализация всего этого на языке Verilog, т.е. подразумевается, что готовая плата будет выполнена на основе FPGA. С одной стороны, это позволит быстро взлететь и в перспективе перейти на заказные чипы, с другой — до этого перехода соотношение цена/качество может быть не на высоте. Хотя душу владельца такой карты будет греть открытость исходников. Читать полностью »

Недавно я опубликовал статью о распределенном рендеринге на GPU — поступили некоторые вопросы и предложения. Поэтому считаю нужным рассказать о теме более развернуто (и с картинками, а то без картинок статьи практически не читают), тем самым привлечь к этой теме больше читателей.
Думаю, этим вопросом заинтересуются обладатели мощных вычислительных систем: майнеры, геймеры, админы других мощных вычислительных систем.

Многие обладатели мощного железа задумывались над тем, а нельзя ли подзаработать на мощности своей железки, пока она стоит бестолку?

Альтернативное использование мощностей GPU?
Красота моя бестоковая!
Читать полностью »

Гостья из будущего — интегрированная графика (Intel GPU) в Intel Haswell

Начну с сообщения для тех, кто не знал, и напоминания для всех остальных — по показаниям неподкупного скрипта подсчета статистики (авторства saul), самым популярным постом 2012 года в блоге компании Intel оказался "Игры разума. Разбираемся с Intel HD Graphics. И играем?" На сегодняшний день его просмотрели более 70 000 раз, что в четыре с половиной раза превышает средний показатель для подобных статей. Что и наводит на мысль — если у Intel GPU такое интересное настоящее, то и ближайшее будущее тоже должно быть интересным.

Этот пост рассказывает про особенности Intel HD Graphics (непосредственно графику, медиа, а также Display Port), интегрированной в выходящий в 2013 Intel CPU под кодовым названием «Haswell», а также проверяет предположение о читательском интересе.
Читать полностью »

Вчера, в рамках проходящей с 8 по 11 января международной выставки потребительской электроники CES 2013 в Лас-Вегасе, США, компания Samsung Electronics представила свою новейшую SoC-разработку: первый в мире 8-ядерный мобильный процессор Exynos 5 Octa, который был создан для последующего применения в передовых планшетах и смартфонах. В основе этого чипа лежит архитектура big.LITTLE, т.е. в процессоре имеются две разные группы ARM-ядер — по четыре вычислительных ядра в каждой, что значительно повышает производительность и энергоэффективность, являющиеся критичными факторами для будущих hi-end гаджетов.

Коротко о новом: Samsung представила первый 8 ядерный процессор Exynos 5 Octa
Читать полностью »

Ресурса Bright Side Of News ссылаясь на свои источники пишет, что новым руководителем Intel может стать один из основателей и генеральный директор Nvidia — Джен-Сен Хуан (Jen-Hsun Huang).
И тогда сама компания Nvidia может быть приобретена корпорацией Intel.

Известно, что ранее Intel уже делала попытки поглотить Nvidia (после того как AMD поглотила компанию ATI), но сам Джен-Сен Хуан, пользующийся широкой поддержкой совета директоров, не соглашался на условия предлагаемые Intel. Кроме того были большие сомнения, что антимонопольные органы США разрешат данное слияние.
Возможность же получения должности гендиректора Intel может изменить позицию Джен-Сен Хуана.
Читать полностью »

Корпорация Intel сообщила о сделке с компанией Creative Technology по приобретению за 50 млн.$ компании ZiiLabs — дочернее предприятие Creative Technology, занимающегося разработкой многоядерных ARM-чипов ZMS-40 и ZMS-20, которые до сих пор применялись в различных Android-устройствах: медиа-плеерах таких как Creative Zii Egg и других аппартах.
Читать полностью »