Полгода назад я начал портировать нейросеть EdgeFace-XS из ONNX в чистый C. Думал — граф небольшой, 1.77M параметров, что может пойти не так? Первый наивный порт выдал 24мс. ONNX Runtime — 3.9мс. В 6 раз медленнее. А потом началась оптимизация.
Результат
|
|
FaceX |
ONNX Runtime 1.23 |
|---|---|---|
|
Медиана |
3.0 мс |
3.9 мс |
|
Минимум |
2.87 мс |
3.18 мс |
|
Размер библиотеки |
148 КБ |
28 МБ |
|
Зависимости |
нет |




