Рубрика «catboost»

Поиск черной кошки в 2000-мерной темной комнате. Турнир алгоритмов машинного обучения

2026-06-08 в 10:21, admin, рубрики: benchmark, catboost, LightGBM, random forest, xgboost, исследование, нейросети, сравнение моделей

Эпиграф

Эксперимент завершен. Результаты выглядят так, будто я немного сломал законы физики привычного табличного ML.

Может быть это соревнование, которого не должно было быть?

Это приглашение к репликации.

Спрятать иголку в стоге сена? Да!

Добро пожаловать на мой маленький тестовый полигон.

Читать полностью »

Как мы научили CatBoost находить борщевик на спутниковых снимках

2026-04-02 в 7:00, admin, рубрики: AI, catboost, computer vision, data science, ml, борщевик, ИИ, экология

Читать полностью »

ML и инфобез: три подхода для поиска аномалий во временных рядах

2026-04-01 в 18:46, admin, рубрики: anomaly detection, autoencoder, catboost, isolation forest, ml

В этой статье будет продемонстрировано применение трёх ML алгоритмов (Isolation Forest, CatBoost, Autoencoder) к решению задачи детекции подозрительных событий в активности пользователей.

Описание задачи

Представьте себе инфраструктуру крупной компании, где хранятся миллионы файлов. Сотрудники постоянно взаимодействуют с ними: читают, изменяют, создают новые. В этом непрерывном потоке событий крайне сложно вручную заметить признаки потенциальной угрозы — будь то инсайдер, копирующий данные, или вирус, массово шифрующий файлы.

Читать полностью »

XGBoost альтернатива CatBoost для работы с категориальными данными???

2025-11-11 в 13:46, admin, рубрики: boosting, catboost, xgboost, категориальные данные, категориальные признаки, сырые данные

Кратко:

22 сентября 2025г. вышла версия 3.10 XGBoost. Основной фишкой новой версии стал "категориальный ре-кодер(categorical re-coder)". Он сохраняет категории в модели и так же может перекодировать данные на этапе инференса. И целью этой статьи является сравнить возможности новой версии XGBoost c лидером обработки категориальных данных, CatBoost.

Основные вопросы:

Кто обучает на сырых данных?
Что такое этот категориальный ре-кодер?
Можно ли обучить модель полностью на сырых данных и получить приемлемый результат?Читать полностью »

ESP32: Базовые алгоритмы машинного обучения

2025-10-01 в 15:37, admin, рубрики: catboost, deep learning, embedded systems, esp32, KNN, MicroTF, TensorFlow, автоматизация, встраиваемые системы, микроконтроллер

ESP32 давно зарекомендовал себя как универсальный микроконтроллер для IoT: он умеет работать с Wi-Fi и Bluetooth, управлять сенсорами и исполнительными устройствами. Но за последние годы стало ясно, что даже на таких простых устройствах можно запускать алгоритмы машинного обучения.

В этой статье рассмотрим, как на ESP32 можно реализовать три базовых алгоритма классификации — дерево решений, метод К-ближайших соседей (KNN) и полносвязную нейросеть на TensorFlow Lite.

Для эксперимента использовался датчик цвета GY-31 (TCS230)Читать полностью »

Лучшие фреймворки для машинного обучения в 2025 году

2025-09-25 в 7:46, admin, рубрики: catboost, jax, LightGBM, ml, pytorch, scikit-learn, TensorFlow, xgboost, фреймворки

Сегодня ни один крупный проект в области машинного обучения (ML) не обходится без фреймворков — готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта.

Читать полностью »

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

2025-08-08 в 19:36, admin, рубрики: catboost, juniorml, kaggle, machinelearning, ml, scikitlearn, titanic, машинноеобучение, соревнование

#Импортируем все необходимые библиотеки

import pandas as pd
from catboost import CatBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json

# 🔕 Отключаем предупреждения, чтобы не загромождали вывод


import warnings
warnings.filterwarnings('ignore')

Читать полностью »

Путь, который занял 100* лет: встречаем CatBoost 1.0.0

2021-10-01 в 10:09, admin, рубрики: Apache Spark, catboost, open source, R, Блог компании Яндекс, машинное обучение, распределенные системы, релизы

Всем привет. Меня зовут Станислав Кириллов, я работаю в команде, которая отвечает за развитие библиотеки машинного обучения CatBoost. Мы впервые поделились ей с сообществом четыре года назад — хотя мы привыкли строить бинарные деревья, поэтому и отсчёт лет предпочитаем вести так же. Это шутка, конечно, но «столетие» — хороший повод для выпуска первой «production ready» версии библиотеки с символичным номером 1.0.0.

Сегодня я кратко отвечу, почему мы считаем выпуск версии 1.0.0 важной вехой, и подсвечу главные изменения (и в новой версии, и в целом за год). А уже завтра выступлю с рассказом на встрече, которая будет целиком и полностью посвящена практике применения CatBoost и противостоянию нейросетей и градиентного бустинга. Если эти слова для вас что-то значат, то добро пожаловать под кат.

Читать полностью »

Оптимизация C++: совмещаем скорость и высокий уровень. Доклад Яндекса

2020-10-15 в 7:16, admin, рубрики: c++, catboost, Блог компании Яндекс, высокая производительность, Компиляторы, профилирование, Процессоры, Серверная оптимизация, управление паматью c++, управление памятью, ускорение кода

Что влияет на скорость работы программ на C++ и как её добиться при высоком уровне кода? Ведущий разработчик библиотеки CatBoost Евгений Петров ответил на эти вопросы на примерах и иллюстрациях из опыта работы над CatBoost для x86_64.

Видео доклада

— Всем привет. Я занимаюсь оптимизацией для CPU библиотеки машинного обучения CatBoost. Основная часть нашей библиотеки написана на C++. Сегодня расскажу, какими простыми способами мы добиваемся скорости.

Оптимизация C++: совмещаем скорость и высокий уровень. Доклад Яндекса - 1
Читать полностью »

Стегоанализ и машинное обучение

2020-02-01 в 4:38, admin, рубрики: catboost, lsb, python, RabbitMQ, информационная безопасность, криптография, машинное обучение, Стеганография

Привет.

Хочу представить вам небольшой проект, который я написал ~~вместо~~ во время сессии.

Суть такова: это классификатор, определяющий наличие стеганографии в изображении. Сразу стоит отметить, что классификатор получился довольно простым: он работает с методом LSB, где заменяется один последний бит 8-битного RGB изображения, и проверялся только на полностью заполненных стегоконтейнерах.
Поиграть с тем, что получилось, можно тут. Примеры картинок (кстати, принимаются только png) есть здесь.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «catboost»

Поиск черной кошки в 2000-мерной темной комнате. Турнир алгоритмов машинного обучения

Эпиграф

Спрятать иголку в стоге сена? Да!

Как мы научили CatBoost находить борщевик на спутниковых снимках

ML и инфобез: три подхода для поиска аномалий во временных рядах

Описание задачи

XGBoost альтернатива CatBoost для работы с категориальными данными???

Кратко:

Основные вопросы:

ESP32: Базовые алгоритмы машинного обучения

Лучшие фреймворки для машинного обучения в 2025 году

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

Путь, который занял 100* лет: встречаем CatBoost 1.0.0

Оптимизация C++: совмещаем скорость и высокий уровень. Доклад Яндекса

Стегоанализ и машинное обучение