|
Набор инструкций |
Год |
Регистры |
Типы операций |
Макс. элементов |
Число команд |
Статус |
|---|---|---|---|---|---|---|
|
MMX |
1997 |
8×64-бит |
Целочисленные |
8×8-бит или 2×32-бит |
57 |
устарел |
|
3DNow! |
1998 |
8×64-бит |
FP32 |
2×32-бит |
21 |
удалён |
|
SSE |
1999 |
8/16×128-бит |
FP32 |
4×32-бит |
70 |
активен |
|
SSE2 |
2000 |
8/16×128-бит |
FP64, целочисленные |
2×64-бит, 16×8-бит |
144 |
активен |
|
SSE3 |
2004 |
8/16×128-бит |
FP, x87 |
4×32-бит |
13 |
активен |
|
SSSE3 |
2006 |
8/16×128-бит |
Целочисленные |
16×8-бит |
32 |
активен |
|
SSE4.1 |
2007 |
8/16×128-бит |
FP, целочисленные |
4×32-бит |
47 |
активен |
|
SSE4.2 |
2008 |
8/16×128-бит |
Строковые, CRC, popcnt |
16 байт |
7 |
активен |
|
SSE4a |
2007 |
8/16×128-бит |
Целочисленные |
— |
4 |
удалён |
|
AVX |
2011 |
16×256-бит |
FP32/FP64 |
8×32-бит, 4×64-бит |
32 |
активен |
|
AVX2 |
2013 |
16×256-бит |
FP и целочисленные |
32×8-бит |
256 |
активен |
|
FMA3 |
2013 |
16×128/256-бит |
FP |
4×64-бит, 8×32-бит |
16 |
активен |
|
FMA4 |
2011 |
16×128/256-бит |
FP |
4×64-бит, 8×32-бит |
41 |
удалён |
|
XOP |
2011 |
16×128/256-бит |
Целочисленные |
16×8-бит |
40 |
удалён |
|
F16C |
2012 |
16×128/256-бит |
FP16 <-> FP32 |
8×16-бит |
2 |
активен |
|
AVX-512 |
2016 |
32×512-бит + маски |
FP, целочисленные, маски |
64×8-бит |
500 |
частично активен |
|
AMX |
2023 |
8×8192-бит тайлы |
INT8, BF16 |
матрицы 16×64 |
10 |
ограниченно активен |
|
AVX10 |
2024 |
32×512-бит |
FP8, FP16, FP32, INT |
512-бит |
50 |
в разработке |
Общее количество всех команд во всех этих расширениях — 1342 инструкции!
От комментариев воздержусь, оставлю эту привилегию читателю ))
При этом SIMD на RiscV очень хвалят, как очень продуманный, минималистичный, при этом мощный и выразительный: https://www.youtube.com/watch?v=lwIBp6cc-HY
Автор: despair
