- PVSM.RU - https://www.pvsm.ru -
Команда Яндекса открыла [1] для всех доступ к библиотеке YaFSDP. Она значительно ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом.
Как отмечают в Яндексе, с помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), которые требуются для обучения. Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру.
Библиотека Яндекса рассчитана в первую очередь на большие языковые модели, хотя она подходит и для других нейросетей — например, таких, которые генерируют изображения. YaFSDP позволяет сократить расходы на оборудование для обучения моделей.
Яндекс разработал YaFSDP в процессе обучения своей генеративной модели нового поколения YandexGPT 3. Компания уже протестировала библиотеку на сторонних нейросетях с открытым исходным кодом. Например, если бы YaFSDP использовалась применительно к модели LLaMA 2, этап предварительного обучения на 1024 графических процессорах сократился бы с 66 до 53 дней.
Источник [2]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/news/391971
Ссылки в тексте:
[1] открыла: https://www.ixbt.com/click/?c=53616c7465645f5f3ce3589624ddaf3adfaaf41266eefcbb2bd6760bf7360b933877e5268ce738b0d13734170892d50115364fda0508b0a497bb49fb2bb7cb080e9a18d4a911070b4d367b5ce406df16&h=691e717b6ff4275bb071474ba49d41164374bc0f
[2] Источник: https://www.ixbt.com/news/2024/06/11/jandeks-opublikoval-svoj-uskoritel-obuchenija-nejrosetej--yafsdp.html
Нажмите здесь для печати.