Рубрика «высокая производительность» - 89

Надёжность Go в инфраструктуре Dropbox

2017-08-07 в 15:41, admin, рубрики: bazel, DropBox, Go, Rust, высокая производительность, Разработка веб-сайтов, состояние гонки

Об авторе: Тэмми Бутов — технический руководитель инфраструктуры для разработчиков в Dropbox. Это управление потоками кода — полный цикл использования Go в Dropbox, от программирования до выпуска. Она выступала на конференции GopherCon 2017 на тему того, как разработчики Dropbox создают и поддерживают работу крупномасштабных сервисов на Go.

Как Dropbox пришёл к использованию Go

Тэмми цитирует статью Роба Пайка «Go в компании Google: языковой дизайн в службе разработки ПО» от 2012 года, поскольку она в целом хорошо передаёт, почему Go хорошо работает и в Dropbox:

«Go — эффективный, масштабируемый и производительный язык. Некоторые программисты получают удовольствие от работы с ним; другие находят его прозаическим, даже скучным. В этой статье мы расскажем, почему все эти позиции не противоречат друг другу. Go спроектирован для решения проблем, возникающих в софтверной разработке в Google, что привело к созданию языка, который не является прорывным с исследовательской точки зрения, тем не менее это прекрасный инструмент для разработки крупных софтверных проектов». — Роб Пайк, 2012

Масштаб Dropbox впечатляет:

Более 500 млн пользователей
200 000 бизнес-пользователей
500 петабайт пользовательских данных
Многоэкзабайтная система хранения Go

Читать полностью »

R c H2O на Spark в HDInsight

2017-08-07 в 6:50, admin, рубрики: "вода, azure, big data, h2o, hdinsight, Microsoft Azure, ml, R, spark, вода, высокая производительность, кругом вода", машинное обучение

H2O – библиотека машинного обучения, предназначенная как для локальных вычислений, так и с использованием кластеров, создаваемых непосредственно средствами H2O или же работая на кластере Spark. Интеграция H2O в кластеры Spark, создаваемые в Azure HDInsight, была добавлена недавно и в этой публикации (являющейся дополнением моей прошлой статьи: R и Spark) рассмотрим построение моделей машинного обучения используя H2O на таком кластере и сравним (время, метрика) его с моделями предоставляемых sparklyr, действительно ли H2O киллер-приложение для Spark?

Читать полностью »

Как я сделал самый быстрый ресайз изображений. Часть 3, числа с фиксированной точкой

2017-08-03 в 11:28, admin, рубрики: avx, AVX2, C, pillow, pillow-simd, python, sse, SSE4, высокая производительность, обработка изображений, оптимизация, производительность, ресайз

Я продолжаю подробно рассказывать о приемах оптимизации, позволивших мне написать самый быстрый ресайз изображений на современных x86 процессорах. На этот раз речь пойдет о преобразовании вычислений с плавающей точкой в вычисления с целыми числами. Сперва я расскажу немного теории, как это работает. Затем вернусь к реальному коду, в том числе SIMD-версии.

В предыдущих частях:

→ Часть 0
→ Часть 1, общие оптимизации
→ Часть 2, SIMD

Читать полностью »

Приглашаем на митап «Java и Linux – Борьба за микросекунды»

2017-08-02 в 15:20, admin, рубрики: java, linux, Блог компании Технологический Центр Дойче Банка, время отклика, высокая производительность, дойче банк, Разработка под e-commerce

Приглашаем на митап «Java и Linux – Борьба за микросекунды» - 1

Привет!

Я, Алексей Рагозин, и мой коллега – Сергей Сорокин приглашаем вас на открытое мероприятие по теме «Java и Linux – Борьба за микросекунды». Мероприятие пройдет во вторник 8 августа в 19.00 в офисе Технологического Центра Дойче Банка. Все подробности и регистрация по ссылке.

Вот о чем мы планируем говорить.
Читать полностью »

Обзор возможностей библиотеки Apache Curator для Apache Zookeeper

2017-08-02 в 6:30, admin, рубрики: curator, distributed computing, distributed lock manager, IPC, java, open source, scala, zookeeper, высокая производительность, параллельное программирование, распределённые вычисления, распределенные системы

По долгу работы мне приходится сталкиваться с проектированием и разработкой распределенных приложений. Такие приложения часто используют различные средства межпроцессного взаимодействия для организации взаимодействия компонентов. Особые сложности возникают в процессе реализации алгоритмов, обрабатывающих связанные данные распределенно. Для поддержки таких задач используются специализированные системы распределенной координации. Самым популярным и широко используемым продуктом является Apache Zookeeper.Читать полностью »

IaaS-дайджест: 30 материалов о работе с ПД, новых технологиях, ИБ и высокой производительности

2017-07-30 в 13:14, admin, рубрики: Блог компании ИТ-ГРАД, высокая производительность, дата-центр, ИТ-ГРАД, Разработка под e-commerce, цод

Здесь мы найдете самые свежие материалы из нашего IaaS-блога. Мы рассказываем о перспективных разработках в сфере высокой производительности, новых технологиях для ЦОД и делимся практическим опытом настройки виртуальной инфраструктуры.

Читать полностью »

Разбираемся с копированием и клонированием

2017-07-27 в 13:21, admin, рубрики: clone, copy, java, Анализ и проектирование систем, Блог компании Mail.Ru Group, высокая производительность, никто не читает теги, отладка

Разбираемся с копированием и клонированием - 1

Я наткнулся на статью Нареша Джоши о копировании и клонировании и был удивлён ситуацией с производительностью. У клонирования есть проблемы с финальными полями. А учитывая тот факт, что интерфейс Cloneable не предоставляет метод clone, то для вызова clone вам необходимо будет знать конкретный тип класса.

Читать полностью »

Быстрое удаление пробелов из строк на процессорах ARM — альтернативный анализ

2017-07-26 в 7:30, admin, рубрики: C, Алгоритмы, высокая производительность, перевод, перевод с английского, Программирование

Оригинал статьи: https://github.com/blu/ascii_pruner
Автор: Мартин Кръстев

Один мой друг обратил мое внимание на интересную статью на habrahabr.ru — русский перевод статьи Дэниела Лемира Быстрое удаление пробелов из строк на процессорах ARM. Эта статья заинтриговала меня по двум причинам: во-первых, кто-то на самом деле потратил время и усилия по поиску оптимального решения общей проблемы на не-x86 архитектуре (ура!), а во-вторых, результаты автор дал в конце статьи немного озадачили меня: порядка 6-ти кратное преимущество для Intel? Автор сделал однозначный вывод, что ARM-у ну очень далеко по соотношению «эффективность на такт» до «большого железа» от Интела в этой простой задаче.

Вызов принят!

Читать полностью »

Быстрое восстановление данных. Схема бабочки для регенерирующих кодов

2017-07-20 в 8:40, admin, рубрики: butterfly, Алгоритмы, Блог компании RAIDIX, высокая производительность, кодирование, математика, регенерирующие коды, системное программирование, системы хранения данных, СХД

Быстрое восстановление данных. Схема бабочки для регенерирующих кодов - 1

Для кодов, описанных в предыдущей статье про восстановление данных, предполагалась постановка задачи, при которой минимизируется количество дисков, необходимых при операции восстановления. В [2] обсуждается применение сетевого кодирования к задачам хранения данных, получившее значительное внимание исследователей в последние годы. Здесь рассматривается не оптимизация количества дисков, необходимых для восстановления данных, а минимизация возникающего при этом сетевого трафика.

Предположим, что система хранения состоит из n узлов. Рассмотрим файл, состоящий из B символов поля GF(q), который кодируется в nα символов над GF(q) и распределяется по узлам, так, что каждый узел хранит α символов. Код построен таким образом, что данные могут быть целиком восстановлены по информации с k узлов. При этом для восстановления данных одного узла достаточно получить β ≤ α информации с d узлов [1,2], см. рис. 1. Величина γ = dβ называется диапазоном восстановления (repair bandwidth).
Читать полностью »

Google планирует представить облачный сервис для квантовых вычислений

2017-07-20 в 8:18, admin, рубрики: Google, Блог компании ИТ-ГРАД, высокая производительность, ИТ-ГРАД, квантовые вычисления

Google собирается открыть онлайн-доступ к своим квантовым машинам для ученых и исследователей проблем искусственного интеллекта. Этим ИТ-гигант хочет «подстегнуть» разработку новых инструментов для своей технологии. Со временем компания планирует создать мощный облачный сервис с использованием квантовых компьютеров.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «высокая производительность» - 89

Надёжность Go в инфраструктуре Dropbox

Как Dropbox пришёл к использованию Go

R c H2O на Spark в HDInsight

Как я сделал самый быстрый ресайз изображений. Часть 3, числа с фиксированной точкой

Приглашаем на митап «Java и Linux – Борьба за микросекунды»

Обзор возможностей библиотеки Apache Curator для Apache Zookeeper

IaaS-дайджест: 30 материалов о работе с ПД, новых технологиях, ИБ и высокой производительности

Разбираемся с копированием и клонированием

Быстрое удаление пробелов из строк на процессорах ARM — альтернативный анализ

Быстрое восстановление данных. Схема бабочки для регенерирующих кодов

Google планирует представить облачный сервис для квантовых вычислений