Рубрика «python» - 144

ПО для машинного обучения на Python

2018-07-03 в 8:30, admin, рубрики: python, Блог компании Инфосистемы Джет, инструментарий, машинное обучение

ПО для машинного обучения на Python - 1

Сегодня существует большое количество программных инструментов для создания моделей Machine Learning. Первые такие инструменты формировались в среде ученых и статистиков, где популярны языки R и Python, исторически сложились экосистемы для обработки, анализа и визуализации данных именно на этих языках, хотя определенные библиотеки машинного обучения есть и для Java, Lua, С++. При этом интерпретируемые языки программирования существенно медленнее компилируемых, поэтому на интерпретируемом языке описывают подготовку данных и структуру моделей, а основные вычисления проводят на компилируемом языке.

В данном посте мы расскажем преимущественно о библиотеках, имеющих реализацию на Python, поскольку этот язык обладает большим количеством пакетов для интеграции в разного рода сервисы и системы, а также для написания различных информационных систем. Материал содержит общее описание известных библиотек и будет полезен прежде всего тем, кто начинает изучать область ML и хочет примерно понимать, где искать реализации тех или иных методов. Читать полностью »

Насколько open-source экосистема R хороша для решения бизнес-задач?

2018-07-03 в 8:15, admin, рубрики: data mining, data science, python, R, визуализация данных

Поводом для публикации послужила запись в блоге Rstudio: «Shiny 1.1.0: Scaling Shiny with async», которая может очень легко пройти мимо, но которая добавляет очень весомый кирпичик в задаче применения R для задач бизнеса. На самом деле, в dev версии shiny асинхронность появилась примерно год назад, но это было как бы несерьезно и «понарошку» — это же dev версия. Перенос в основную ветку и публикация на CRAN является важным подтверждением, что многие принципиальные вопросы продуманы, решены и протестированы, можно спокойно переносить в продуктив и пользоваться.

А что еще есть в R, кроме «бриллианта», что позволяет превратить его в универсальный аналитический инструмент для практических задач?

Является продолжением предыдущих публикаций.Читать полностью »

Catboost для самых маленьких

2018-07-02 в 18:11, admin, рубрики: open source, python, машинное обучение

18 июля 2017 года компания Яндекс выложила в открытый доступ свою новую разработку – Catboost. И всё с ним хорошо и документация имеется, инструмент простой и понятный, как оказалось.

Предыстория

Через некоторое время после выхода Catboost автору нужно было выбрать тему выпускной квалификационной работы. Руководитель ВКР предложил несколько тем на выбор и среди них была «Классификация музыкальных записей по жанрам». Интересная тема, с научным уклоном, да и средства реализации уже имеются.

Время шло и нужно было уже начинать работу над ВКР. Была собрана информация по теме, скачаны отрывки музыкальных записей различных жанров, намечен алгоритм. Однако, изучение Catboost было осложнено тем, что автор не имел опыта работы с машинным обучением, а все статьи с примерами и документация были рассчитаны на определённый уровень знаний и опыта по теме (да, маленький. Но начать – всегда самое сложное).

Начался панический поиск информации и вопросы к осведомлённым людям. Багаж знаний рос, но оставались непонятыми какие-то маленькие определения, которые настолько известны всем осведомлённым, что никто и внимания на них не обращает, ведь без них никуда! Их и не хватало для работы с библиотекой.

В итоге, нужная информация была найдена чёрт знает где и вновь её отыскать довольно проблематично.

Читать полностью »

Сортировки вставками

2018-07-02 в 11:57, admin, рубрики: java, python, Алгоритмы, алгоритмы сортировки, визуализация данных, Программирование

Общая суть сортировок вставками такова:

Перебираются элементы в неотсортированной части массива.
Каждый элемент вставляется в отсортированную часть массива на то место, где он должен находиться.

Читать полностью »

Преступление и наказание в программировании

2018-07-02 в 9:37, admin, рубрики: C#, c++, Go, golang, java, javascript, php, python, Программирование

Потребовалось переписать код с одного языка на другой, и возникла странная ситуация. Одинаковый с виду листинг ведет себя совершенно по-разному. В виду того, что кода действительно много, ошибку очень сложно заметить. На примере данной ситуации порассуждаем, насколько разные языки программирования?!

Читать полностью »

Введение в Data classes

2018-07-01 в 18:12, admin, рубрики: dataclass, python

Одна из новых возможностей, появившихся в Python 3.7 — классы данных (Data classes). Они призваны автоматизировать генерацию кода классов, которые используются для хранения данных. Не смотря на то, что они используют другие механизмы работы, их можно сравнить с "изменяемыми именованными кортежами со значениями по-умолчанию".

Введение

Все приведенные примеры требуют для своей работы Python 3.7 или выше

Большинству python-разработчикам приходится регулярно писать такие классы:

class RegularBook:
    def __init__(self, title, author):
        self.title = title
        self.author = author

Уже на этом примере видна избыточность. Идентификаторы title и author используются несколько раз. Реальный класс же будет ещё содержать переопределенные методы __eq__ и __repr__.

Модуль dataclasses содержит декоратор @dataclass. С его использованием аналогичный код будет выглядеть так:

@dataclass
class Book:
    title: str
    author: str

Читать полностью »

Сравнение сортировок обменами

2018-06-29 в 12:02, admin, рубрики: php, python, Алгоритмы, алгоритмы сортировки, Программирование, Тестирование IT-систем

Сравнение сортировок обменами - 1

Сферические алгоритмы в вакууме — это прекрасно. Однако давайте спустимся с небес на грешную землю и посмотрим как вся эта теоретическая красота покажет себя на практике.
Читать полностью »

Как пушить ивенты из Veeam Backup & Replication в мессенджеры

2018-06-28 в 14:07, admin, рубрики: docker, python, sql, teams, veeam backup and replication, Блог компании «Veeam Software», Восстановление данных, резервное копирование, системное администрирование

Всем привет! В этом посте я расскажу о том, как доставлять информацию о результатах действий из Veeam Backup & Replication v9.5 в MS Teams. Описанный в посте способ будет работать не только в этом, но и в любом другом мессенджере — потребуется только организовать доставку сообщений, используя профильный API.

Как пушить ивенты из Veeam Backup & Replication в мессенджеры - 1
Читать полностью »

Создание management commands в Django

2018-06-24 в 19:00, admin, рубрики: django, python

Management commands — команды, выполняемые из командной строки с помощью скрипта manage.py.

Наиболее частые сферы применения — это действия, выполняемые разово или периодически, но для которых почему-либо недоступен запуск через планировщик. Например, отправка пользователям разовых сообщений, получение выборки данных из БД, проверка наличия необходимых файлов и папок перед накатыванием обновлений, быстрое создание объектов модели при разработке и т.д.
Читать полностью »

Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin

2018-06-24 в 15:40, admin, рубрики: apache zeppelin, open source, python, анализ данных, аналитика, Аналитика мобильных приложений, аналитика проекта, Блог компании Pixonic, визуализация, визуализация данных, разработка игр, система аналитики, Управление продуктом

Все рано или поздно приходят к аналитике за данными. В больших многопользовательских играх (да и синглплеере) без этого уже вообще никуда. Сколько пользователей предпочитают новый режим; где слабые места монетизации; куда смотреть геймдизайнерам, чтобы повысить вовлеченность игроков; и еще миллион вещей — подсчитывается вообще всё. И всё это влияет на решения, которые потом принимают разработчики.

А вот внедряют аналитику все по-разному: кто-то покупает сторонние решения (просто, но негибко), кто-то пишет под себя (долго и дорого), а кто-то пока просто считает несколько базовых метрик силами программистов и не заморачивается.

Поэтому я расскажу об инструменте, который будет полезен для всех. Кто только начинает выстраивать аналитику — сможет «на коленке» создать систему с нуля, а компании с уже готовыми решениями — «бустануть» свой подход.
Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin - 1 Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «python» - 144

ПО для машинного обучения на Python

Насколько open-source экосистема R хороша для решения бизнес-задач?

Catboost для самых маленьких

Сортировки вставками

Преступление и наказание в программировании

Введение в Data classes

Введение

Сравнение сортировок обменами

Как пушить ивенты из Veeam Backup & Replication в мессенджеры

Создание management commands в Django

Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «python» - 144

Введение

Новости

Актуальные темы

Архив