Рубрика «высокая производительность» - 3

Порой приходится слышать: «Отладчики бесполезны, гораздо целесообразнее иметь дело с логированием и модульными тестами». Подозреваю, что многие из разделяющих такое мнение думают, будто отладчик только и может, что расставлять точки останова на определённых строках, пошагово просматривать код и проверять значения переменных. Притом, что любой годный отладчик действительно всё это может, на самом деле это только верхушка айсберга. Задумайтесь: мы уже вполне можем наткнуться на код, которому около 40 лет – наверняка же с тех пор что-то изменилось?  

Tl;drЧитать полностью »

22 342 кратное ускорение загрузки геометрии в Unity - 1

Немного истории

Меня зовут Артем Толстогузов, и я вхожу в группу анонимных Unity‑программистов.

У меня:

  • навязчивое желание переложить всю работу с CPU на GPU;

  • небольшой фетиш в области оптимизаций всего что только возможно;

  • хронический интерес к шейдерам, графическому пайплайну и технологиям;

  • Читать полностью »

6 февраля пользователи могли заметить частичную недоступность сервисов Яндекса. Проблема возникла из-за каскадного сбоя в работе сетевого оборудования.

Основной пик пришёлся на период с 17:03 до 17:50, когда общие потери трафика достигали 40%. Кроме того, в период с 17:03 до 17:13 наблюдалась практически полная потеря IPv6 трафика. Инцидент удалось устранить к 21:30.

Как это произошло и какие выводы мы из этого извлекли — ответим на эти вопросы и поделимся нашим опытом.

О сетевой аварии в Яндексе - 1

Читать полностью »

CAMM — то, что должно сделать ноутбуки ещё тоньше и быстрее - 1

За последние два десятка лет появилось не так уж много инноваций в сфере дизайна памяти для ноутбуков. Уже как четверть века большой популярностью пользовались небольшие модули памяти с двухрядным расположением выводов, SO-DIMM (Small outline DIMM). В 2022 году Dell выпустила два ноутбука, Precision 7670 и 7770, которые дебютировали с новым форм-фактором для оперативной памяти, называемым CAMM (Compression Attached Memory Module).

После анонса ноутбуков Dell заявила, что Precision 7670 и 7770 будут самыми мощными среди профессиональных моделей. 16-дюймовый 7670 имеет толщину 0,98 дюйма, а 17-дюймовый 7700 — 1,13 дюйма, что является впечатляющими показателями для мобильных рабочих станций, оснащённых при этом выделенными графическими процессорами. И всё это стало возможным благодаря CAMM.

CAMM в настоящее время ратифицируется для общеотраслевого использования органом по стандартизации памяти, JEDEC. А окончательная спецификация должна быть опубликована позже в этом году. Розничные ноутбуки основанные на окончательной омологации CAMM появятся в 2024 году.

CAMM — то, что должно сделать ноутбуки ещё тоньше и быстрее - 2

Читать полностью »

Выжимаем максимум из логики — сверхбыстрый, но прожорливый сумматор - 1

ПЛИС-культ привет, FPGA хаб!

Давненько я не писал полноценных статей на хабре, всё больше как-то занимался организацией FPGA движа: всякими там новостными подборками, ютуб стримами по FPGA, организацией плисовых конференций и много чем другим.

Но всё новое — хорошо забытое старое, поэтому решил изложить в текстовом виде несколько идей, которые легли в основу стримов.

И в этой заметке предлагаю вам погрузиться в небольшое исследование c реализацией конвейеризованного многоразрядного сумматора всего с 1 уровнем логики, эдакого LUTа в сферическом вакууме, идеи которого, я уверен, найдут отклик в исследовательских работах начинающих адептов программируемой логики.

Читать полностью »

Js, трюки, наблюдения, бенчмарки и как Лиса уничтожает Хром. Я протестировал всё, что вам было лень - 1

Картинка, конечно, стронгли анрилейтед

Разные трюки я тестировал на Google Chrome 107.0.5304.107 и Mozilla Firefox 107.0 на Windows 10.

Чтобы результаты всегда были железно воспроизводимыми, я отключил все С-State’ы, ядра зафиксировал на 5 ГГц.

У меня 9900К, это Coffee Lake c AVX256, какие оптимизации применит Jit для вашего процессора — я не знаю, результат на вашем компьютере может отличаться от моего, в т.ч. из-за микроархитектуры процессора.

Скорость парсинга кода тоже входит в бенчмарк, поэтому браузер с быстрым парсером будет впереди.
Читать полностью »

Задача коммивояжера (TSP) точное решение — метод целочисленного линейного программирования (Integer programming) - 1

Все пути одинаковы: они ведут в никуда. Но у одних есть сердце, а у других — нет. Один путь дает тебе силы, другой — уничтожает тебя.

- Карлос Кастанеда

Читать полностью »

Это очень хорошой case для оптимизации. Алгоритм крайне прост и его знают все. Но сколько можно сделать!

1. Julia, попытка первая и наивная

Julia хорошо изображает из себя питоно-подобный язык с утиной типизацией, будучи по реализации совершенно не питоно подобной. При том что синтаксис у нее отличается от Питона (и индексы начинаются с 1), почти каждую строчку надо переписывать, но все эти переписывания кажутся довольно тривиальными, что делает ее хорошим языком для проекта, когда Python уже жмет. Но эта похожесть может сыграть дурную службу.

Наша первая реализация:

Читать полностью »

Первый одноплатник линейки Nvidia Jetson компания Nvidia представила в 2019 году. Достоинство устройства — высокая производительность и небольшой размер. Кроме того, есть и еще один плюс — это совместимость с Raspberry Pi. Недавно команда студентов Южного методистского университета (Даллас, штат Техас, США), представила компактный суперкомпьютер на основе 16 устройств Nvidia Jetson Nano. Почему именно первая модель одноплатного ПК использовалась в проекте и для кого разработали кластерную систему на его основе?

Читать полностью »

Привет всем, в эфире Асахи Лина!✨

marcan попросил меня написать статью о M1 GPU, и вот она готова ~! Это был долгий проект, растянувшийся на несколько месяцев, и было о чём поведать, так что, надеюсь, вам понравится!

Что такое GPU

Пожалуй, вы знаете, что такое GPU, но известно ли вам, как он работает под капотом? Давайте посмотрим! Почти у всех современных GPU одни и те же основные компоненты:

  • Набор шейдерных ядер, обрабатывающих треугольники (вершинные данные) и пиксели (фрагментные данные), выполняя программы, определяемые пользователем. Они используют разные кастомные наборы инструкций для каждого GPU!

  • Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js