Рубрика «kaggle»

Титаник глазами новичка в 2026

2026-01-17 в 13:08, admin, рубрики: AI, data science, kaggle, kaggle competition, ml, titanic

Всем привет! В этой небольшой статье хочу поделиться своим первым опытом работы с ML-моделями.

С чего все началось?

В начале 3 семестра я попал на проект ВУЗа, связанный с НС. Прошел курс по сеткам, пробежался по Pytorch и приступил к задачам на проекте. В процессе своего спринта решил параллельно изучать классический ML, где собственно выяснил, что "Hello world!" в мире машинного обучения является работа с датасетом титаник (предсказать выжил ли пассажир или нет). После этого ознакомился с Kaggle и полетел!

Titanic - Machine Learning from Disaster

При открытии "компетитив" сразу же наткнулся на тот самый Читать полностью »

Анализ EEG-датасетов с Kaggle: от сигнала до ML-модели

2025-10-30 в 19:06, admin, рубрики: data science, EEG, kaggle, python

Электроэнцефалография (ЭЭГ) — это неинвазивный метод регистрации электрической активности мозга через электроды на поверхности головы. За последние годы ЭЭГ-данные перестали быть исключительно медицинской прерогативой и прочно вошли в мир data science. Сегодня их используют в нейромаркетинге для оценки реакций на рекламу, в когнитивных исследованиях для измерения внимания и памяти, в разработке Brain-Computer Interface (BCI) и даже в спортивной аналитике.

Популярность ЭЭГ объясняется несколькими факторами:

Доступность: относительно недорогие портативные устройства (Emotiv, Muse, OpenBCI)
БезопасностьЧитать полностью »

Полезные задачи на Kaggle ( LLM, Diffusion Models)

2025-09-16 в 15:01, admin, рубрики: AI, deep learning, diffusion models, kaggle, llm, machine learning

В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.

Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:

🌍 более 13 миллионов участников из разных стран;
🏆 сотни активных соревнований ежегодно;
📊 миллионы доступных датасетов и готовых ноутбуков.

Читать полностью »

Автомобили в кино. Kaggle-датасет на 1,75 миллиона строк

2025-09-14 в 13:17, admin, рубрики: data, dataset, kaggle, визуализация данных, парсинг

На imcdb.org энтузиасты уже два десятка лет отмечают автомобили в фильмах: кадры, марки, модели. Верифицируют находки на форуме, спорят о деталях. В итоге появилась крупнейшая база “машин-актёров” в кино: 1,75 млн страниц с кадрами и описаниями транспорта из фильмов разных стран. Я собрал всё это в один датасет.

Читать полностью »

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

2025-08-08 в 19:36, admin, рубрики: catboost, juniorml, kaggle, machinelearning, ml, scikitlearn, titanic, машинноеобучение, соревнование

#Импортируем все необходимые библиотеки

import pandas as pd
from catboost import CatBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json

# 🔕 Отключаем предупреждения, чтобы не загромождали вывод


import warnings
warnings.filterwarnings('ignore')

Читать полностью »

Прогнозируем движение беспилотного автомобиля (или как я вышел в тройку лидеров на Yandex Cup 2024)

2025-01-31 в 11:42, admin, рубрики: data science, kaggle, LightGBM, machine learning, python, yandex cup 2024, беспилотные автомобили, чемпионат по программированию

*фотографии чемпионата взяты из телеграм-канала чемпионата

Меня зовут Николай Назаров, я работаю аналитиком данных в X5 Tech. Недавно завершился чемпионат по программированию Yandex Cup ML Challenge 2024 Читать полностью »

Как делать бизнес в Open Source

2024-09-04 в 8:57, admin, рубрики: data science, Evidently AI, kaggle, open source, гиперпараметры, интервью, композиции моделей, машинное обучение, технологический стек

Эмели Драль — кофаундер и технический директор Evidently AI. У её open source библиотеки для оценки, тестирования и мониторинга качества данных и моделей машинного обучения уже более 22 миллионов скачиваний.

26 сентября Эмели выступит на AI Conf 2024 с докладом «Читать полностью »

В IT в 30. Как я стал solo Kaggle Grandmaster, устроился на работу, но так и не стал программистом

2022-08-15 в 8:45, admin, рубрики: Gamedev, kaggle, ml, войти в IT, Карьера в IT-индустрии, машинное обучение, разработка игр

Читать полностью »

Дата-сайентист, который просто не может перестать выигрывать на Kaggle

2021-01-24 в 11:57, admin, рубрики: data science, kaggle, machine learning, skillfactory, Блог компании SkillFactory, интервью, машинное обучение, Программирование, соревнования, Хакатоны

Ранее у нас в блоге уже был материал про лучших в Kaggle, а сегодня представляю вам интервью с признанным дата-сайентистом и гроссмейстером Kaggle Филиппом Сингером, который поделится своим опытом, вдохновением и и достижениями. Беседа призвана мотивировать и воодушевить других людей, которые хотят понять, что нужно, чтобы стать гроссмейстером Kaggle. Также в этом интервью мы узнаем больше об академическом прошлом Филиппа, его увлечении Kaggle и о его работе в качестве дата-сайентиста.

Дата-сайентист, который просто не может перестать выигрывать на Kaggle - 1

Читать полностью »

Магия Ensemble Learning

2020-10-17 в 9:49, admin, рубрики: big data, data engineering, data science, Ensemble Learning, kaggle, machine learning, Portfolio Diversification, Блог компании OTUS. Онлайн-образование

Привет! Приглашаем Data Engineer'ов и специалистов по Machine Learning на бесплатный Demo-урок «Вывод ML моделей в промышленную среду на примере онлайн-рекомендаций». А также мы публикуем статью Luca Monno — Head of Financial Analytics at CDP SpA.

Одним из наиболее полезных и простых методов машинного обучения является Ensemble Learning. Ensemble Learning – это метод, лежащий в основе XGBoost, Бэггинга, Случайного Леса и многих других алгоритмов.

На Towards Data Science есть много классных статей, но я выбрал две истории (первая и Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «kaggle»

Титаник глазами новичка в 2026

С чего все началось?

Titanic - Machine Learning from Disaster

Анализ EEG-датасетов с Kaggle: от сигнала до ML-модели

Полезные задачи на Kaggle ( LLM, Diffusion Models)

Автомобили в кино. Kaggle-датасет на 1,75 миллиона строк

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

Прогнозируем движение беспилотного автомобиля (или как я вышел в тройку лидеров на Yandex Cup 2024)

Как делать бизнес в Open Source

В IT в 30. Как я стал solo Kaggle Grandmaster, устроился на работу, но так и не стал программистом

Дата-сайентист, который просто не может перестать выигрывать на Kaggle

Магия Ensemble Learning