- PVSM.RU - https://www.pvsm.ru -

Microsoft и Amazon представили новую библиотеку для машинного обучения — Gluon

На прошлой неделе Amazon Web Services (AWS) и Microsoft представили открытую библиотеку Gluon для машинного обучения. Создатели утверждают [1], что она позволит разработчикам легко прототипировать и развёртывать сложные модели машинного обучения в облаке.

Microsoft и Amazon представили новую библиотеку для машинного обучения — Gluon - 1 [2]
/ Flickr / Cory Doctorow [3] / CC [4]

Gluon предлагает понятный и ёмкий API. Модели в библиотеке определяются и управляются как любые другие данные. Также есть возможность быстро создавать прототипы и использовать динамические графы нейросетей для новых архитектур без ущерба скорости обучения.

По словам [5] главы подразделения искусственного интеллекта AWS Мэтта Вуда (Matt Wood), машинное обучение с помощью нейросетей состоит из трех основных компонентов: данных для обучения, модели нейросети и обучающего алгоритма. Нейросеть похожа на ориентированный граф: входные данные соединяются с выходными через нейронные слои, синапсы которых имеют определенные веса. Во время обучения алгоритм корректирует веса на основе ошибок в выходных данных. Это традиционный способ обучения сети. Он может длиться несколько дней или дольше.

Фреймворки для глубокого обучения помогают ускорить процесс. Но работа с ними требует от пользователя дополнительных усилий: формального определения графа, планирования и корректировки весов.

Настраивать сеть, в которой миллионы соединений, приходится вручную. Поэтому сети глубокого обучения громоздкие и их трудно отлаживать. Использовать их код для других проектов также сложно.

Особенности Gluon

Разработчики Gluon попытались упростить создание интеллектуальных технологий. В AWS заявляют [5], что основные преимущества Gluon — динамические графы, быстрая интеграция и масштабируемое обучение.

  • Понятный API. Сети Gluon настраиваются с помощью простого и ёмкого кода. При этом Gluon поддерживает сложные методы: динамические графы и гибкие структуры, но разработчику нет необходимости разбираться в конкретных деталях или оптимизировать все вручную.
  • Разные типы данных. Gluon поддерживает работу с разряженными и квантованными данными. Разряженные данные часто обрабатываются при обработке естественного языка.
  • Динамические сети. В Gluon сети определяются динамически, что делает их гибкими, как любую другую структуру данных. Алгоритм динамически настраивает сеть во время определения и обучения. Это означает, что разработчики смогут использовать стандартные циклы и условия для создания сетей.
  • Производительность. Встроенная поддержка [6] циклов и невырожденных тензоров позволяет эффективно выполнять алгоритмы для моделей RNN и LSTM. При этом Gluon предлагает автоматическое распределение задач на несколько графических процессоров.

Gluon — открытый и бесплатный продукт. Найти его можно на GitHub [7].

Другие библиотеки

Помимо Gluon, за последние месяцы появились ещё несколько библиотек. Компания IBM с помощью PowerAI DDL [8] обучила нейросеть Resnet-50 на основе данных ImageNet за 50 минут. Для этого разработчики задействовали 64 сервера с 4 графическими процессорами в каждом.

Библиотека Deeplearn.js [9] от Google позволяет обучать нейросети в браузере без установки софта. Разработчики компании заявляют [9], что библиотека может стать платформой для быстрого прототипирования, визуализации и офлайн-вычислений.

CatBoost [10] — это алгоритм градиентного бустинга на деревьях решений от разработчиков компании «Яндекс». Новая версия продукта CatBoost version 0.2 вышла в сентябре и уже опубликована на GitHub [11]. CatBoost основан на принципах универсального алгоритма MatrixNet, который используется в компании «Яндекс» для ранжирования задач и прогнозирования.

Ссылки по теме

Напоследок предлагаем вам небольшую подборку инструментов и материалов, касающихся разработки интеллектуальных систем. Например, пользователи Quora советуют обратить внимание на следующие ресурсы:

А пользователи Reddit предложили к просмотру подборку бесплатных ресурсов для самообучения [29] и курируемый список с фреймворками и библиотеками Awesome Machine Learning [30].

Несколько фреймворков и полезных материалов вы найдете по ссылкам здесь [31] и тут [29].

P.S. О чем еще мы пишем в нашем блоге:

Автор: 1cloud

Источник [39]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/mashinnoe-obuchenie/266031

Ссылки в тексте:

[1] утверждают: http://www.businesswire.com/news/home/20171012005742/en/AWS-Microsoft-Announce-Gluon-Making-Deep-Learning

[2] Image: https://habrahabr.ru/company/1cloud/blog/340406/

[3] Cory Doctorow: https://www.flickr.com/photos/doctorow/2711081060/

[4] CC: https://creativecommons.org/licenses/by-sa/2.0/

[5] словам: https://aws.amazon.com/ru/blogs/aws/introducing-gluon-a-new-library-for-machine-learning-from-aws-and-microsoft/

[6] поддержка: https://www.microsoft.com/en-us/cognitive-toolkit/blog/2017/10/microsoft-aws-advance-open-ai-ecosystem-gluon-partnership/

[7] GitHub: https://github.com/gluon-api/gluon-api/

[8] PowerAI DDL: https://venturebeat.com/2017/08/07/ibms-new-tool-boosts-deep-learning-speed-but-only-for-its-hardware/

[9] Deeplearn.js: https://www.infoworld.com/article/3216464/machine-learning/googles-deeplearnjs-brings-machine-learning-to-the-browser.html

[10] CatBoost: https://catboost.yandex/

[11] GitHub: https://github.com/catboost/catboost/issues

[12] TensorFlow: https://www.tensorflow.org/

[13] интерактивная среда: http://playground.tensorflow.org/#activation=tanh&batchSize=10&dataset=circle&regDataset=reg-plane&learningRate=0.03&regularizationRate=0&noise=0&networkShape=4,2&seed=0.76781&showTestData=false&discretize=false&percTrainData=50&x=true&y=true&xTimesY=false

[14] Keras: https://keras.io/

[15] Caffe2: https://caffe2.ai/

[16] Paddle: http://www.paddlepaddle.org/

[17] Theano: http://deeplearning.net/software/theano/

[18] Torch: http://torch.ch/

[19] MLJAR: https://mljar.com/

[20] Scikit: http://scikit-learn.org/stable/

[21] Numpy: http://www.numpy.org/

[22] Scipy: https://www.scipy.org/

[23] Pandas: http://pandas.pydata.org/

[24] NLTK: http://www.nltk.org/

[25] Weka: https://weka.wikispaces.com/Use+WEKA+in+your+Java+code

[26] H2O: https://www.h2o.ai/

[27] Java-ML: http://java-ml.sourceforge.net/

[28] Apache Mahout: https://mahout.apache.org/

[29] самообучения: https://www.reddit.com/r/engineering/comments/6i3nxy/a_list_of_helpful_certificates_free_training/

[30] Awesome Machine Learning: https://github.com/josephmisiti/awesome-machine-learning

[31] здесь: https://www.kdnuggets.com/2016/04/top-15-frameworks-machine-learning-experts.html

[32] Безопасность данных в облаке: https://1cloud.ru/blog/bezopasnost-dannih-v-oblake

[33] Облачное хранилище данных: https://1cloud.ru/blog/oblachnoe-hranilische

[34] Backup и Snapshot: отличия и применение: https://1cloud.ru/blog/razlichija-backup-i-snapshot

[35] Виртуальная сеть в облаке: https://1cloud.ru/blog/virtualnaya-set-v-oblake

[36] Backup&Recovery: поточная и умная дедупликация, снапшоты и вторичное хранение: https://1cloud.ru/blog/backup-recovery

[37] Немного о безопасности в «облаке»: https://1cloud.ru/blog/security-cloud

[38] Тренды облачной безопасности: https://1cloud.ru/blog/cloud-safety-trends

[39] Источник: https://habrahabr.ru/post/340406/