Рубрика «simd»

Моё знакомство с процессором Эльбрус-8СВ. Оптимизирую сложение массива байтов

2025-12-20 в 8:15, admin, рубрики: E2K, simd, VLIW, ассемблер, интринсики, оптимизация кода, Си, Эльбрус, эльбрус-8св

Месяц назад мне в телеграм написал человек и предложил доступ к системе с процессором Эльбрус-8СВ.
И конечно же я согласился. Так как мне интересно.
Не каждый день неизвестные люди предлагают доступ к удалённым хостам.

Меня зовут Леонид Лагунов и я математик-программист.
Я решил написать про своё знакомство с процессором Эльбрус.

Привет! На связи Антон Полухин из Техплатформы Городских сервисов Яндекса, и сейчас я расскажу о софийской встрече Международного комитета по стандартизации языка программирования C++, в которой принимал активное участие. Это была последняя встреча, на которой новые фичи языка, с предодобренным на прошлых встречах дизайном, ещё могли попасть в C++26.

И результат превзошёл все ожидания:

compile-time-рефлексия
рефлексия параметров функций
аннотации
std::optional<T&‍>
параллельные алгоритмы

Читать полностью »

Зажигаем миллиард цветов миллионом строк

2025-06-20 в 5:33, admin, рубрики: .net, C#, c++, DirectX, HLSL, simd, Мониторы и ТВ, ненормальное программирование, подсветка, Программирование

16K

Вот мы и добрались до финальной части, в которой я расскажу, как делал большой софт, который управляет большой подсветкойЧитать полностью »

SIMD на x86 — чудовище Франкенштейна?

2025-05-28 в 11:21, admin, рубрики: avx, AVX2, mmx, simd, x86

Набор инструкций	Год	Регистры	Типы операций	Макс. элементов	Число команд	Статус
MMX	1997	8×64-бит	Целочисленные	8×8-бит или 2×32-бит	57	устарел
3DNow!	1998	8×64-бит	FP32	2×32-бит	21	удалён
SSE	1999	8/16×128-бит	FP32	4×32-бит	Читать полностью »

Решение задачи с Route 256 на goalng

2025-05-11 в 16:21, admin, рубрики: avx, golang, simd, x86-64

В этой статье разбирается решение задачи «Гистограммы» с контеста Route 256 от Ozon.

Ссылочки:
Assembler в Go: техники ускорения и оптимизации / Хабр
Руководство по ассемблеру Go / Хабр
Часть 1. Почему Go-ассемблер и векторизация могут быть полезны: идея для ускорения / Хабр

Условие задачи

Читать полностью »

Часть 1. Почему Go-ассемблер и векторизация могут быть полезны: идея для ускорения

2025-05-07 в 9:02, admin, рубрики: golang, intermediate representation, intrinsic, optimization, simd, ssa, VMOV, ассемблер, машинный код, синтаксис

Читать полностью »

Более быстрые хеш-таблицы: претенденты на место SwissTable

2025-03-31 в 9:01, admin, рубрики: Chronicle-Map, F14, Koloboke, ruvds_статьи, simd, SmoothieMap, swisstable, uniform probing, ассоциативный массив, вставка, дерево с поворотом, красно-черное дерево, крошечные указатели, линейное зондирование, наука о данных, поиск, предельная скорость, равномерное зондирование, расширяющееся дерево, структура данных, хеш-таблицы

24 ноября 2021 года на сайте ArXiv.org была опубликована научная статья «Крошечные указатели» (Tiny Pointers) с описанием новой структуры данных — «крошечных» указателей, которые указывают путь к фрагменту хранимых данных и занимают меньше памяти, чем традиционные указатели.

Осенью 2021 года эту статью заметил Андрей Крапивин (Andrew Krapivin), студент Ратгерского университета в Нью-Джерси, и не придал ей особого значения, пишет Quanta Magazine, журнал о последних достижениях в математике (перевод статьи на Хабре). Только через два года он нашёл время, чтобы внимательно ознакомиться с материалом. И понял, насколько это прорывное изобретение, если применить его для оптимизации хеш-таблиц.

Данная тема уже упоминалась на Хабре, но заслуживает более подробного обсуждения.
Читать полностью »

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA

2025-03-22 в 10:16, admin, рубрики: c++, CUDA, openmp, simd, мандельброт, оптимизация

Построение множества Мандельброта — классический пример чрезвычайно параллельной задачи (embarrassingly parallel problem).

Вначале мы разберем наивную реализацию, поиграемся с интринсиками (intrinsics) и, не теряя переносимости, заставим компилятор генерировать нам SIMD-инструкции. Далее добавим многопоточность и в заключение обесценим все наши старания несколькими строчками на CUDA.

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA - 1

Читать полностью »

Векторизация в RISC-V. Основы

2025-03-21 в 11:00, admin, рубрики: asic, risc-v, simd, SystemVerilog, векторизация

Многие современные вычислительные задачи, в частности повсеместная обработка изображений и звука или работа с матрицами для ИИ, хорошо поддаются параллелизации на уровне данных. Входные данные таких задач представлены в виде большого вектора данных, элементы которого можно обрабатывать независимо. Чтобы ускорить вычисления с векторами, производители процессоров добавили в архитектуры специальные Single Instruction, Multiple Data инструкции, которые позволяют работать за одну инструкцию сразу с несколькими элементами.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «simd»

Моё знакомство с процессором Эльбрус-8СВ. Оптимизирую сложение массива байтов

Содержание:

Итоги встречи ISO C++ на Гавайях: начинаем полировку стандарта С++26

Встреча ISO C++ в Софии: С++26 и рефлексия

Зажигаем миллиард цветов миллионом строк

SIMD на x86 — чудовище Франкенштейна?

Решение задачи с Route 256 на goalng

Условие задачи

Часть 1. Почему Go-ассемблер и векторизация могут быть полезны: идея для ускорения

Более быстрые хеш-таблицы: претенденты на место SwissTable

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA

Читать полностью »

Векторизация в RISC-V. Основы