Рубрика «compilers»

Как создать свой парсер и AST-генератор на C++ с минимальными усилиями: знакомьтесь с QapDSLv2

2025-07-09 в 9:00, admin, рубрики: AST, c++, compilers, dsl, Lexers, parser, parser-generator, parsers, QapDSL

QapDSLv2 — это язык который транслируется в обычный C++ код. Он позволяет удобно и компактно задавать грамматики и правила разбора, значительно упрощая разработку компиляторов и анализаторов.

Про соседнюю статью

Я решил выложить сразу две стать в одно время. В этой статье всё про QapDSLv2, а в той про QapGen — крутой генератор парсеров из QapDSLv2.

Читать полностью »

QapDSL — декларативное описание AST и парсеров для C++

2025-06-05 в 14:19, admin, рубрики: Adler3D, AST, compilers, Lexers, QapDSL

QapDSL — декларативное описание AST и парсеров для C++ - 1

QapDSL — декларативное описание AST и парсеров для C++

QapDSL — это специализированный язык (DSL), который позволяет описывать абстрактные синтаксические деревья (AST) и правила их разбора для языков программирования, прежде всего C++. Такая формализация помогает автоматизировать построение парсеров, генерацию кода, анализ исходников и даже рефакторинг.

Зачем нужен QapDSL?

Компактно и наглядно описывать структуру и грамматику языка.
Автоматически генерировать C++-структуры, парсеры, сериализаторы и визиторы.
Ускорять эксперименты с языками, создавая прототипы компиляторов и анализаторов.
Упрощать анализ и рефакторинг сложных языков, в т.ч. C++.

Пример QapDSL-описания

Рассмотрим, как описывается объявление класса C++ на QapDSL:

t_class{
  string keyword;
  t_sep sep0;
  string name;
  t_sep sep1;
  TAutoPtr<t_parents> parents;
  t_sep sep2;
  TAutoPtr<t_class_body> body;
  t_sep sep3;
  {
    M+=go_any_str_from_vec(keyword,split("struct,class,union",","));
    O+=go_auto(sep0);
    M+=go_str<t_name>(name);
    O+=go_auto(sep1);
    O+=go_auto(parents);
    O+=go_auto(sep2);
    O+=go_auto(body);
    O+=go_auto(sep3);
    M+=go_const(";");
  }
}

Читать полностью »

Elixir: алхимия кодогенерации

2025-03-06 в 16:15, admin, рубрики: BEAM, compilers, Elixir, erlang

Elixir - язык, вызвавшийся заново открыть Erlang современному миру. Синтаксис без приятных сердцу, но уже архаичных знаков пунктуации; культура разработки с особым вниманием к качеству и удобству инструментов; полноценный набор решений для написания web-сервисов; стандартная библиотека без груза в несколько десятилетий и настоящие макросы.

Читать полностью »

Я ускорил генерацию blurhash в 3̶6̶ 8̶7̶ 128 раз

2024-10-11 в 21:44, admin, рубрики: blurhash, clang, compilers, gcc, pillow, simd

Старую собаку новым трюкам не обучишь, вот и я взялся за старое. Blurhash — это компактный способ представления размытой превьюшки изображения в виде ASCII-строки. Разработан финской компанией Wolt (аналог Delivery Club). Давно хотелось внедрить такое к себе в API, чтобы любой клиент мог более плавно и изящно делать загрузку контент на своем сайте. Но сколько я на него смотрел — всегда не давала покоя скорость работы, уж больно медленно и «в лоб» он был написан. Но вот время пришло наконец-то разобраться, что же он так медленно работает.

Читать полностью »

Что будет, если скрестить конструирование компиляторов, DDD и Clean Architecture? Опыт HydraScript

2024-09-03 в 14:01, admin, рубрики: clean architecture, compiler design, compilers, csharp, DDD, design patterns, dotnet, github, golang, open source, ruvds_статьи, solid, TypeScript

В этой статье я расскажу о двухлетнем эксперименте, проводимом над моим пет-проектом, интерпретатором ЯП HydraScript. Почему к разработке из области системного программирования были применены промышленные практики, и зачем конструированию компиляторов нужен Domain Driver Design с чистой архитектурой?

Исходники проекта Читать полностью »

Как поделить не деля или оптимизация деления компиляторам(и)

2024-08-02 в 16:13, admin, рубрики: compilers, division, optimisation, optimization

Если вы никогда не пробовали смотреть как код на C++ разворачивается компилятором в код Assembly – вас ждёт много сюрпризов, причём, не нужно смотреть какой-то замудренный исходный код полный templates или других сложных конструкций: рассмотрите следующий snippet:

uint8_t div10(uint8_t x)
{
    return x/10;
}

Читать полностью »

Почему WebAssembly плохо годится для Java

2023-08-27 в 12:07, admin, рубрики: compilers, java, jvm, webassembly

Как разработчик TeaVM Читать полностью »

C++23 — финал, C++26 — начало

2023-02-20 в 9:00, admin, рубрики: C, c++, c++23, c++26, c23, compilers, exception, exception handling, iso, ranges, stacktrace, standard library, Блог компании Яндекс, Компиляторы, Программирование, С++, с++23, с++26, с23

С момента моей прошлой публикации состоялось уже две встречи международного комитета по стандартизации C++.

Комитет занимался полировкой C++23:

static operator[];
static constexpr в constexpr-функциях;
безопасный range-based for;
взаимодействие std::print с другими консольными выводами;
монадический интерфейс для std::expected;
static_assert(false) и прочее.

И прорабатывал новые фичи C++26:

std::get и std::tuple_size для агрегатов;
#embed;
получение std::stacktrace из исключений;
stackful-корутины.

Читать полностью »

Самый быстрый компилятор aka compiler-benchmark

2020-11-13 в 11:24, admin, рубрики: compilers, D, dlang, Компиляторы, Программирование

От переводчика: все началось с топика на форуме D.

После оценки скорости компиляции D по сравнению с другими языками мне было интересно, существует ли какой-нибудь язык, который компилируется в нативный код почти так же быстро или быстрее, чем D, за исключением C?
Если да, то скорее всего, он должен использовать бэкэнд, отличный от LLVM.
Я думаю, что Jai способен на это, но он еще не вышел в релиз.

Бенчмарки скорости компиляции различных комбинаций языков и компиляторов. Поддерживаемые языки:

Компиляторы в нативный код

C (gcc, clang и cproc),
C++ (g++ и clang++),
D (dmd ldmd2, и gdc),
Go (go и gccgo),
Swift (swiftc),
Rust (rustc),
Julia (julia).
Ada (gnatgcc),
Zig (zig),
V (v),
Vox (vox),
C3 (c3c),Читать полностью »

Парсеры Пратта для чайников

2020-03-27 в 12:16, admin, рубрики: AST, compilers, Go, golang, parser, Компиляторы, Программирование

Рекурсивный спуск работает идеально, когда вы можете принимать решение относительно разбираемого куска кода с помощью текущего контекста и токена.

Картину портят выражения: постфиксные, инфиксные и прочие. Проблема: вы не можете понять, какого типа выражение вы обрабатываете до тех пор, пока не разберёте его первую половину. Зачастую для вас также важны приоритет операции и её ассоциативность, чтобы построенное AST имело правильную структуру.

После хаков для того, чтобы успешно парсить инфиксные выражения в рекурсивном спуске, через код становится трудно разглядеть разбираемую парсером грамматику.

В этой статье мы напишем парсер для диалекта Go, особенности которого мы рассмотрим чуть ниже. Как вы сможете убедиться, алгоритм Пратта решает большинство наших проблем.

Парсеры Пратта для чайников - 1

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «compilers»

Как создать свой парсер и AST-генератор на C++ с минимальными усилиями: знакомьтесь с QapDSLv2

Про соседнюю статью

QapDSL — декларативное описание AST и парсеров для C++

QapDSL — декларативное описание AST и парсеров для C++

Зачем нужен QapDSL?

Пример QapDSL-описания

Elixir: алхимия кодогенерации

Я ускорил генерацию blurhash в 3̶6̶ 8̶7̶ 128 раз

Что будет, если скрестить конструирование компиляторов, DDD и Clean Architecture? Опыт HydraScript

Как поделить не деля или оптимизация деления компиляторам(и)

Почему WebAssembly плохо годится для Java

C++23 — финал, C++26 — начало

Самый быстрый компилятор aka compiler-benchmark

Компиляторы в нативный код

Парсеры Пратта для чайников