Рубрика «glu»

Занимаясь созданием систем искусственного интеллекта, не перестаешь удивляться, из каких порой «костылей» состоят настоящие чудеса прогресса. Например, знаете ли вы, что даже самые современные нейросети фундаментально не умеют перемножать два числа? Они не считают в привычном нам смысле, а скорее запоминают и аппроксимируют ответы.

Как так вышло, что ИИ пишет код и сочиняет стихи, но буксует на таблице умножения? Давайте разбираться.

Фундаментальная проблема: сложение вместо умножения

Читать полностью »

На этой диаграмме, взятой из статьи, показана относительная производительность LLM без MatMul по сравнению с обычным (Transformer++) LLM на контрольных примерах

На этой диаграмме, взятой из статьи, показана относительная производительность LLM без MatMul по сравнению с обычным (Transformer++) LLM на контрольных примерах Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js