Рубрика «параллельное программирование» - 32

Изучаем Storm Framework. Часть III

2013-07-15 в 13:43, admin, рубрики: BigData, java, storm framework, параллельное программирование, метки: BigData, java, storm framework

Во второй части статьи рассказывалось о механизмах обнаружения ошибок в процессе обработки.

Обработка завершилась с ошибкой, что делать дальше? Вполне возможно, что потеряна связь с одним из узлов кластера или временно недоступна база данных. В этом случае, нельзя с уверенностью сказать, какие операции выполнились успешно, а какие — нет. Если все операции в цепочке повторно применимы (идемпотентны), например установка флага, то можно просто перезапустить обработку. Если нет, то на помощь приходят механизмы транзакций Storm.
Читать полностью »

Изучаем Storm Framework. Часть II

2013-07-12 в 13:45, admin, рубрики: BigData, java, storm framework, параллельное программирование, метки: BigData, java, storm framework

В первой части рассматривались базовые понятия Storm.

Разные классы задач предъявляют различные требования к надежности. Одно дело пропустить пару записей при подсчете статистики посещений, где счет идет на сотни тысяч и особая точность не нужна. И совсем другое — потерять, например, информацию о платеже клиента.

Далее рассмотрим о механизмы защиты от потери данных, которые реализованы в Storm.
Читать полностью »

Не бойтесь велосипедов. Или еще один Grand Central Dispatch (GCD) на C++11

2013-07-10 в 17:59, admin, рубрики: c++, c++11, GCD, велосипед на ракетном топливе, велосипедостроение, велосипеды, параллельное программирование, Программирование, метки: c++11, GCD, велосипед на ракетном топливе, велосипедостроение, велосипеды, параллельное программирование

ИМХО (Имею Мнение Хрен Оспоришь)

С моей точки зрения самое полезное, что может сделать программист для повышения своего профессионального уровня — это написание велосипедов. Велосипедостроение — очень увлекательный процесс. Иногда он увлекает больше, чем задача, ради которой сам велосипед и затевался. При написании велосипеда (под велосипедом я понимаю реализацию уже существующего) происходит более глубокое понимание уже существующих решений и техник.
Не бойтесь велосипедов. Или еще один Grand Central Dispatch (GCD) на C++11
Читать полностью »

Изучаем Storm Framework. Часть I

2013-07-10 в 14:58, admin, рубрики: BigData, java, storm framework, параллельное программирование, метки: BigData, java, storm framework

В 2011 году Twitter открыл, под лицензией Eclipse Public License, проект распределенных вычислений Storm. Storm был создан в компании BackType и перешел к Twitter после покупки.

Storm это система ориентированная на распределенную обработку больших потоков данных, аналогичная Apache Hadoop, но в реальном времени.

Ключевые особенности Storm:

Масштабируемость. Задачи обработки распределяются по узлам кластера и потокам на каждом узле.
Гарантированная защита от потери данных.
Простота развертывания и спровождения.
Восстановление после сбоев. Если какой либо из обработчиков отказывает, задачи переадресуются на другие обработчики.
Возможность написания компонентов не только на Java. Простой Multilang protocol с использованием JSON объектов. Есть готовые адаптеры для языков Python, Ruby и Fancy.

В первой части рассматриваются базовые понятия и основы создания приложения c использованием Storm версии 0.8.2.
Читать полностью »

Техника написания аналога await/async из C# для C++

2013-07-05 в 13:23, admin, рубрики: boost, c++, coroutine, асинхронное программирование, параллельное программирование, Программирование, метки: boost, c++, coroutine, асинхронное программирование

Обычно в таких статьях делают заголовок вида «аналог await/async для C++», а их содержимое сводится к описанию ещё одной библиотеки, выложенной где-то в интернете. Но в данном случае нам не требуется ничего подобного и заголовок точно отражает суть статьи. Почему так смотрите ниже.Читать полностью »

Одним махом 100 миллионов убивахом. Или lock-free распределитель памяти

2013-06-10 в 5:41, admin, рубрики: atomic, c++, c++11, lock-free, threads, параллельное программирование, Программирование, метки: atomic, c++11, lock-free, threads

Постановка задачи

Один из алгоритмов, который я реализовывал, имел интересные особенности при работе с памятью:

Могло выделяться огромное количество, до десятков и сотен миллионов небольших объектов одного типа.
Объекты представляли собой POD- типы.
POD

A Plain Old Data Structure in C++ is an aggregate class that contains only PODS as members, has no user-defined destructor, no user-defined copy assignment operator, and no nonstatic members of pointer-to-member type.
Заранее было неизвестно какое количество объектов понадобится, могло так случится, что потребуется сотня, а может и сто миллионов.
Объекты никогда не удаляются по одному, в какой-то момент они становятся не нужны все сразу.
Алгоритм хорошо распараллеливается, по этому выделением объектов занимается одновременно несколько потоков, по количеству ядер процессора(ов).

Использование в таких условиях стандартного new – delete приводит к очень большим потерям времени на удаление объектов. Если без отладчика удаление происходило хотя бы за несколько секунд, то в присутствии отладчика освобождение памяти замедляется примерно в 100(!) раз, и отладка проекта становится просто невозможной. Кроме того из-за большого количества выделенных объектов достаточно ощутимым становился перерасход памяти на внутренние данные расперделителя памяти.
Для решения задачи выделения огромного количества объектов одного типа, и их пакетного удаления, был сделан lock-free контейнер MassAllocator. Код компилируется Visual Studio 2012. Полный код проекта выложен на github.
Читать полностью »

Dryad. Фреймворк распределенных вычислений

2013-06-05 в 6:33, admin, рубрики: big data, computer science, высокая производительность, высокопроизводительные вычисления, параллельное программирование, параллельные вычисления, метки: big data, computer science, высокопроизводительные вычисления, параллельные вычисления

Представьте себе фреймворк общего назначения для распределенного исполнения приложений со следующими статистическими показателями*:

Dryad. Фреймворк распределенных вычислений
* Статистические данные за 2011 год.

А теперь представьте, что это не Hadoop.

О том, что это за фреймворк, о идеях и концепциях, заложенных в его основу и о том, почему этот фреймворк даже более инновационный (субъективно), чем Hadoop, речь пойдет ниже.
Читать полностью »

Ускорь свой код и найди иголку в стоге сена

2013-05-13 в 4:34, admin, рубрики: Accelerate Your Code, Блог компании Intel, параллельное программирование, Программирование, метки: Accelerate Your Code

Ускорь свой код и найди иголку в стоге сена
Каждый день тысячи спутников, самолетов, камер наблюдения делают миллионы снимков высокого разрешения. Чтобы добыть оттуда полезную информацию, их надо обработать – и эта задача даже на первый взгляд не кажется легкой. Именно благодаря своей сложности (а также большому простору для распараллеливания) она и стала содержанием летнего тура конкурса Intel «Accelerate Your Code», который проходит с 1 мая по 31 августа. В этот раз в условиях конкурса произошли некоторые изменения, а вот главный приз остался прежним – победитель получит ультрабук стоимостью 1000 евро.
Читать полностью »

Генератор Федеративного Фильтра Калмана с использованием Генетических Алгоритмов

2013-05-01 в 12:30, admin, рубрики: .net, async, genetic algorithms, parallel programming, simulation, tpl, Алгоритмы, генетические алгоритмы, параллельное программирование, фильтр калмана, метки: async, genetic algorithms, parallel programming, simulation, tpl, генетические алгоритмы, фильтр калмана

В рамках своей научной активности реализовал так называемый Федеративный Фильтр Калмана (Federated Kalman Filter). В этой статье рассказывается о том, что такое «Федеративный ФК», чем он отличается от обобщенного, а также описывается консольное приложение, реализующее данный фильтр и генетические алгоритмы для подбора параметров его математической модели. Приложение было реализовано с использованием TPL (Task Parallel Library), поэтому пост будет интересен не только специалистам по цифровой обработке сигналов.
Читать полностью »

Пишу игрушечную ОС (о планировщике)

2013-04-20 в 23:42, admin, рубрики: diy или сделай сам, параллельное программирование, планирование, прерывание, системное программирование, метки: планирование, прерывание

Пишу игрушечную ОС (о планировщике)
Продолжаю вести блог о разработке игрушечной ОС.

В прошлом посте я писал о том, как добиться возможности реализовывать на C обработчики прерываний. Теперь, пользуясь написанными ранее макросами, можно реализовать простой SMP-планировщик. Он будет предоставлять минимально возможный функционал, на базе которого в будущем нужно будет возводить различные надстройки, в частности, примитивы синхронизации (например, мьютекс). Опять же, красивая модульная структура не способствует высокой производительности, но красота, как известно, спасёт мир, так что отдадим ей предпочтение.

Итак, попробуем сформулировать требования к нашему планировщику. Нам нужна возможность создать поток, указать для него стек, маску разрешённых логических процессоров (affinity), базовый приоритет и функцию выполнения. Далее, поток можно запустить, приостановить, продолжить его выполнение и, наконец, завершить.

Кроме того, было бы здорово, если бы планировщик не занимался выделением памяти, а мог принимать и возвращать память, выделенную под поток кем-то другим. С одной стороны, это бы обеспечило гибкость произвольного кеширования памяти потоков. С другой – дало бы уникальную возможность сохранять поток во внешней памяти (например, на жёстком диске) с последующей его загрузкой и запуском с прерванного места.
Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «параллельное программирование» - 32

Изучаем Storm Framework. Часть III

Изучаем Storm Framework. Часть II

Не бойтесь велосипедов. Или еще один Grand Central Dispatch (GCD) на C++11

ИМХО (Имею Мнение Хрен Оспоришь)

Изучаем Storm Framework. Часть I

Техника написания аналога await/async из C# для C++

Одним махом 100 миллионов убивахом. Или lock-free распределитель памяти

Постановка задачи

Dryad. Фреймворк распределенных вычислений

Ускорь свой код и найди иголку в стоге сена

Генератор Федеративного Фильтра Калмана с использованием Генетических Алгоритмов

Пишу игрушечную ОС (о планировщике)

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «параллельное программирование» - 32

ИМХО (Имею Мнение Хрен Оспоришь)

Постановка задачи

Новости

Актуальные темы

Архив