В современных нейросетях критически важно, сколько физической памяти занимает каждый параметр. В этой работе я попытался уйти от классического float32 в нейросетевом слое к uint8 без квантования. Для этого все вычисления проводились сразу по правилам арифметики остатков в конечном поле Галуа GF(137).
Стоит сказать, что это не замена обычному инференсу и не попытка доказать, что все должны срочно переписать модели на вычеты по модулю 137. Я взял небольшой слой, байтовые веса, нативное ядро, ARM NEON и несколько базовых реализаций для сравнения.


![Почему в С++ массивы нужно удалять через delete[] - 1 delete_or_delete_for_array_ru/image1.png](https://www.pvsm.ru/images/2022/07/28/pochemu-v-s-massivy-nujno-udalyat-cherez-delete.png)



