Рубрика «numpy»

Ускоряем Python в сто раз при помощи менее чем ста строк на Rust

2023-04-30 в 14:15, admin, рубрики: numpy, pyo3, python, Rust, ruvds_перевод, библиотеки python, Блог компании RUVDS.com, оптимизация производительности

Однажды на работе у нас возникла проблема с производительностью одной из наших основных Python-библиотек.

Эта библиотека формирует фундамент нашего конвейера 3D-обработки. Это довольно большая и сложная библиотека, использующая NumPy и другие научные пакеты Python для выполнения широкого спектра математических и геометрических операций.

Кроме того, наша система должна работать на мощностях компании с ограниченными ресурсами CPU, и хотя поначалу она справлялась хорошо, с ростом количества одновременных физических пользователей у нас начали возникать проблемы, а наша система едва выдерживала нагрузку.

Мы пришли к выводу, что для работы с увеличившейся нагрузкой нужно сделать систему, по крайней мере, в пятьдесят раз быстрее, и решили, что помочь в этом нам может Rust.

Так как проблемы производительности, с которыми мы столкнулись, встречаются довольно часто, мы можем воссоздать и решить их прямо здесь, в (не такой уж короткой) статье.

Так что заварите себе чаю (или кофе) и я расскажу вам (а) о самой проблеме и (б) о нескольких итерациях оптимизаций, которые мы смогли применить для решения этой проблемы.

Если вы хотите сразу перейти к получившемуся коду, то читайте раздел «Подведение итогов».
Читать полностью »

Пишем GPT в 60 строк NumPy

2023-02-16 в 6:45, admin, рубрики: gpt, language model, numpy, python, Алгоритмы, искусственный интеллект, математика, машинное обучение, чат-бот, языковые модели

В этом посте мы реализуем с нуля GPT всего в 60 строках numpy. Затем мы загрузим в нашу реализацию опубликованные OpenAI веса обученной модели GPT-2 и сгенерируем текст.
Читать полностью »

Перцептрон на numpy

2023-01-21 в 19:07, admin, рубрики: deep learning, from scratch, numpy, perceptron, python, машинное обучение, нейросеть, обучение, персептрон

Я придерживаюсь мнения, что если хочешь в чем-то разобраться, то реализуй этой сам. Когда я только начинал заниматься датасаенсом, я разобрался, как считать градиенты на бумажке, перескочил этап реализации сеток на numpy и сразу стал их обучать. Однако, когда спустя долгое я всё-таки решил это сделать, то столкнулся с тем, что не могу это сделать, потому что у меня не сходятся размерности.

Перебрав множество материалов, я остановился на книге Deep Learning from Scratch. Теперь я разобрался, и хочу сделать свой туториал.

Читать полностью »

Генерация музыки из изображений с помощью Python

2023-01-06 в 13:00, admin, рубрики: librosa, numpy, python, ruvds_перевод, Блог компании RUVDS.com, генерация музыки, звук

Сказать, что музыка является частью моей жизни, будет серьёзным преуменьшением. Я более 20 лет играю на гитаре, и каждый день слушаю других гитаристов. По правде говоря, прежде чем начать свой академический путь в качестве физхимика двенадцать лет назад, я был намерен строить музыкальную карьеру.

И хотя этим моим планам ну было суждено осуществиться, я всё равно продолжаю наслаждаться музыкой и делать с её помощью всякие крутые штуки. К примеру, этот проект возник из идеи написать программу, которая бы создавала музыку из изображений. В прошлом уже были довольно интересные попытки сделать нечто подобное, но вот результаты оказывались не особо музыкальными.

Далее в этой статье я расскажу о своём подходе к генерации из картинок аудиотреков, которые, имхо, звучат весьма неплохо. Здесь я опишу основные результаты и покажу некоторые удачные примеры программы. Если вы захотите посмотреть весь код, то он лежит на моём сайте и в репозитории GitHub. Я также создал с помощью Streamlit приложение, с которым вы можете поэкспериментировать здесь.Читать полностью »

Работа с поверхностными и глубокими копиями в Python

2022-12-02 в 13:00, admin, рубрики: data engineering, numpy, pandas, python, ruvds_перевод, Блог компании RUVDS.com, глубокое копирование, датафреймы, копирование данных, Программирование

В этой статье объясняется, как делать копии списков Python, массивов NumPy и датафреймов Pandas при помощи операций получения срезов, списочного индексирования (fancy indexing) и логического (boolean indexing). Эти операции очень часто используются при анализе данных и должны рассматриваться всерьёз, поскольку ошибочные предположения могут привести к падению быстродействия или неожиданным результатам.

Python кажется простым, но всякий раз, возвращаясь к его азам, ты находишь новые для освоения вещи. Здесь на ум приходит известное изречение Эйнштейна:

«Чем больше я узнаю, тем больше понимаю, как много я ещё не знаю».

Читать полностью »

Как посчитать количество звёзд на фото?

2021-11-13 в 17:58, admin, рубрики: jpg, numpy, python, skimage, sklearn, звезды, искусственный интеллект, машинное обучение, обработка изображений, сегментация, фото

Всем привет!

Недавно я участвовал в олимпиаде по искусственному интеллекту на Python и там было много интересных задач, но самая интересная это про звезды на небе: "Дано фото звездного неба с земли. Задача: определить количество звёзд на небе"

Вроде бы не сложно, если фотка только со звездами, например:

Читать полностью »

Перегон картинок из Pillow в NumPy-OpenCV всего за два копирования памяти

2021-03-08 в 6:37, admin, рубрики: numpy, opencv, pillow, python, обработка изображений

Стоп, что? В смысле «всего»? Разве преобразование из одного формата в другой нельзя сделать за одно копирование, а лучше вообще без копирования?

Да, это кажется безумием, но более привычные методы преобразования картинок работают в 1,5-2,5 раза медленнее (если нужен не read-only объект). Сегодня я покопаюсь в кишках обеих библиотек, расскажу почему так получилось и кто виноват. А также покажу финальный результат, который работает так же, только быстрее. Никаких репозиториев или пакетов не будет, только рассказ и рабочий код в конце. Но давайте обо всём по порядку.

Pillow Читать полностью »

Склеиваем несколько фотографий в одну длинную с помощью машинного обучения

2020-08-22 в 13:25, admin, рубрики: numpy, opencv, python, SIFT, машинное обучение, ненормальное программирование, обработка изображений, Программирование

В предыдущих статьях был описан шеститочечный метод разворачивания этикеток и как мы тренировали нейронную сеть. В этой статье описано, как склеить фрагменты, сделанные из разных ракурсов, в одну длинную картинку.
Склеиваем несколько фотографий в одну длинную с помощью машинного обучения - 1 Читать полностью »

Загрузка NumPy-массивов с диска: сравнение memmap() и Zarr-HDF5

2020-03-05 в 9:30, admin, рубрики: numpy, python, Блог компании RUVDS.com, Накопители, разработка, Разработка веб-сайтов

Если ваш NumPy-массив слишком велик для того, чтобы полностью поместиться в оперативной памяти, его можно обработать, разбив на фрагменты. Сделать это можно либо в прозрачном режиме, либо явно, загружая эти фрагменты с диска по одному.

В такой ситуации можно прибегнуть к двум классам инструментов:

Метод NumPy memmap(), прозрачный механизм, который позволяет воспринимать файл, расположенный на диске, так, будто он весь находится в памяти.
Похожие друг на друга форматы хранения данных Zarr и HDF5, которые позволяют, по необходимости, загружать с диска и сохранять на диск сжатые фрагменты массива.

У каждого из этих методов есть свои сильные и слабые стороны.

Материал, перевод которого мы сегодня публикуем, посвящён разбору особенностей этих методов работы с данными, и рассказу о том, в каких ситуациях они могут пригодиться. В частности, особое внимание будет уделено форматам данных, которые оптимизированы для выполнения вычислений и необязательно рассчитаны на передачу этих данных другим программистам.
Читать полностью »

Сканирующее окно по массивам NumPy

2020-02-24 в 15:19, admin, рубрики: moving window, numpy, python, rolling window, sliding window, Алгоритмы, массивы, метод скользящего окна, оптимизация кода, Программирование, Совершенный код

CoLab блокнот с примерами

Возможно сделать скользящее окно (rolling window, sliding window, moving window) по массивам NumPy на языке программирования Python без явных циклов. В данной статье рассматривается создание одно-, двух-, трех- и N-мерных скользящих окон по массивам NumPy. В результате скорость обработки данных увеличивается в несколько тысяч раз и сравнима по скорости с языком программирования С.

Cкользящее окно применяется в: обработке изображений, искусственных нейронных сетях, интернет протоколе TCP, обработке геномных данных, прогнозировании временных рядов и т.д.

Отказ от ответственности: в исходном коде могут быть ошибки! Если вы видите ошибку, пожалуйста, напишите мне.

Введение
Скользящее 1D окно по ND массиву в Numpy
Скользящее 2D окно по ND массиву в Numpy
Скользящее 3D окно по ND массиву в Numpy
Скользящее MD окно по ND массиву, где M ≤ N
Скользящее MD окно по ND массиву для любых M и N

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «numpy»

Ускоряем Python в сто раз при помощи менее чем ста строк на Rust

Пишем GPT в 60 строк NumPy

Перцептрон на numpy

Генерация музыки из изображений с помощью Python

Работа с поверхностными и глубокими копиями в Python

Как посчитать количество звёзд на фото?

Перегон картинок из Pillow в NumPy-OpenCV всего за два копирования памяти

Склеиваем несколько фотографий в одну длинную с помощью машинного обучения

Загрузка NumPy-массивов с диска: сравнение memmap() и Zarr-HDF5

Сканирующее окно по массивам NumPy

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «numpy»

Новости

Актуальные темы

Архив