Рубрика «simd» - 2

Зажигаем миллиард цветов миллионом строк

2025-06-20 в 5:33, admin, рубрики: .net, C#, c++, DirectX, HLSL, simd, Мониторы и ТВ, ненормальное программирование, подсветка, Программирование

16K

Вот мы и добрались до финальной части, в которой я расскажу, как делал большой софт, который управляет большой подсветкойЧитать полностью »

SIMD на x86 — чудовище Франкенштейна?

2025-05-28 в 11:21, admin, рубрики: avx, AVX2, mmx, simd, x86

Набор инструкций	Год	Регистры	Типы операций	Макс. элементов	Число команд	Статус
MMX	1997	8×64-бит	Целочисленные	8×8-бит или 2×32-бит	57	устарел
3DNow!	1998	8×64-бит	FP32	2×32-бит	21	удалён
SSE	1999	8/16×128-бит	FP32	4×32-бит	Читать полностью »

Решение задачи с Route 256 на goalng

2025-05-11 в 16:21, admin, рубрики: avx, golang, simd, x86-64

В этой статье разбирается решение задачи «Гистограммы» с контеста Route 256 от Ozon.

Ссылочки:
Assembler в Go: техники ускорения и оптимизации / Хабр
Руководство по ассемблеру Go / Хабр
Часть 1. Почему Go-ассемблер и векторизация могут быть полезны: идея для ускорения / Хабр

Условие задачи

Читать полностью »

Часть 1. Почему Go-ассемблер и векторизация могут быть полезны: идея для ускорения

2025-05-07 в 9:02, admin, рубрики: golang, intermediate representation, intrinsic, optimization, simd, ssa, VMOV, ассемблер, машинный код, синтаксис

Читать полностью »

Более быстрые хеш-таблицы: претенденты на место SwissTable

2025-03-31 в 9:01, admin, рубрики: Chronicle-Map, F14, Koloboke, ruvds_статьи, simd, SmoothieMap, swisstable, uniform probing, ассоциативный массив, вставка, дерево с поворотом, красно-черное дерево, крошечные указатели, линейное зондирование, наука о данных, поиск, предельная скорость, равномерное зондирование, расширяющееся дерево, структура данных, хеш-таблицы

24 ноября 2021 года на сайте ArXiv.org была опубликована научная статья «Крошечные указатели» (Tiny Pointers) с описанием новой структуры данных — «крошечных» указателей, которые указывают путь к фрагменту хранимых данных и занимают меньше памяти, чем традиционные указатели.

Осенью 2021 года эту статью заметил Андрей Крапивин (Andrew Krapivin), студент Ратгерского университета в Нью-Джерси, и не придал ей особого значения, пишет Quanta Magazine, журнал о последних достижениях в математике (перевод статьи на Хабре). Только через два года он нашёл время, чтобы внимательно ознакомиться с материалом. И понял, насколько это прорывное изобретение, если применить его для оптимизации хеш-таблиц.

Данная тема уже упоминалась на Хабре, но заслуживает более подробного обсуждения.
Читать полностью »

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA

2025-03-22 в 10:16, admin, рубрики: c++, CUDA, openmp, simd, мандельброт, оптимизация

Построение множества Мандельброта — классический пример чрезвычайно параллельной задачи (embarrassingly parallel problem).

Вначале мы разберем наивную реализацию, поиграемся с интринсиками (intrinsics) и, не теряя переносимости, заставим компилятор генерировать нам SIMD-инструкции. Далее добавим многопоточность и в заключение обесценим все наши старания несколькими строчками на CUDA.

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA - 1

Читать полностью »

Векторизация в RISC-V. Основы

2025-03-21 в 11:00, admin, рубрики: asic, risc-v, simd, SystemVerilog, векторизация

Многие современные вычислительные задачи, в частности повсеместная обработка изображений и звука или работа с матрицами для ИИ, хорошо поддаются параллелизации на уровне данных. Входные данные таких задач представлены в виде большого вектора данных, элементы которого можно обрабатывать независимо. Чтобы ускорить вычисления с векторами, производители процессоров добавили в архитектуры специальные Single Instruction, Multiple Data инструкции, которые позволяют работать за одну инструкцию сразу с несколькими элементами.

Читать полностью »

О новых алгоритмах хеш-таблиц

2025-03-01 в 13:07, admin, рубрики: simd, swisstable, хеш-таблицы

Хотелось бы прокомментировать публикацию Ильи Кабанова в Медузе по поводу новых разработок в алгоритмах хеширования: "Optimal Bounds for Open Addressing Without Reordering" (Farach-Colton, Krapivin, and Kuszmaul, 2025) и последующую "The Bathroom Model: A Realistic Approach to Hash Table Algorithm Optimization" (Wang, 2025). И особенно кликбейтное: "в перспективе метод Крапивина и его коллег может ускорить многие процессы в интернете."

Я около 7 лет очень плотно занимался темой хеш-таблиц и написал много их вариантов: Читать полностью »

C++26 — встреча ISO в Хагенберге

2025-02-19 в 8:13, admin, рубрики: byte, c++, c++26, c++29, constexpr, contracts, embed, exception, Hive, memory, object pool, reflection, relocation, safety, security, simd, undefined behavior, С++, с++26, с++29

В середине февраля в Хагенберге состоялась встреча международного комитета по стандартизации языка программирования C++.

В этот раз прорабатывались следующие большие темы:

std::hive
Constexpr, ещё больше constexpr
Безопасность, контракты, hardening, профили, UB и std::launder
Relocate
#embed

Читать полностью »

Японские суперкомпьютеры: 40 лет семейству NEC SX

2025-01-22 в 9:00, admin, рубрики: ACOS, cray, GCOS, NEC, NEC SX-1, NEC SX-2, simd, SUPER-UX, sx, SX-ACE, SX-Aurora, SX-OS, Vector Engine, veos

Широко известно, что японцы изобрели аниме, суши и Годзиллу, а также выпустили на рынок большое число популярных ноутбуков настольных ПК. Однако родиной суперкомпьютеров считаются Соединенные Штаты Америки: именно там собирали самые мощные вычислительные машины. Тем не менее, в Японии тоже существовали свои суперкомпьютеры, самыми известными из которых считаются машины линейки NEC SX, появившиеся на свет 40 лет назад.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «simd» - 2

Зажигаем миллиард цветов миллионом строк

SIMD на x86 — чудовище Франкенштейна?

Решение задачи с Route 256 на goalng

Условие задачи

Часть 1. Почему Go-ассемблер и векторизация могут быть полезны: идея для ускорения

Более быстрые хеш-таблицы: претенденты на место SwissTable

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA

Читать полностью »

Векторизация в RISC-V. Основы

О новых алгоритмах хеш-таблиц

C++26 — встреча ISO в Хагенберге

Японские суперкомпьютеры: 40 лет семейству NEC SX