Мы частенько шутим с коллегами , что любые действия можно поделить на «обезьяньи» и «smart»Читать полностью »
Мы частенько шутим с коллегами , что любые действия можно поделить на «обезьяньи» и «smart»Читать полностью »
Когда пришло время выбирать тему диплома, я, как и многие студенты, понятия не имел, о чём писать. После мозгового штурма с одногруппниками родилась идея, которая из простого «варианта для защиты» превратилась в полноценный инженерный проект: «исследование и разработка системы автоматического распознавания дефектов печатных плат».
Со временем я понял, что выбрал тему не случайно - это реально актуальная задача для производства, где качество пайки напрямую влияет на работоспособность устройств, а ещё отличный шанс пройти весь цикл Computer Vision проекта от сбора данных до обучения моделей.
|
Инструмент |
Оценка |
Сильная сторона |
|---|---|---|
|
Perplexity AI |
4.20/5 |
Точность + RAG архитектура |
|
ChatGPT |
3.85/5 |
MoE + GPT-4o мультимодальность |
|
DeepSeek |
3.75/5 |
MoE эффективность + бесплатно |
|
Gemini |
3.35/5 |
Контекст 1M + видео обработка |
В любой крупной компании данных всегда больше, чем понимания, что с ними делать. Они лежат в базах, логах, документах — огромный слабоструктурированный ресурс. Идея о том, что можно научить машину находить в этом хаосе полезные паттерны, когда-то казалась фантастикой, а сегодня это работа руководителя отдела машинного обучения Postgres Professional Савелия Батурина. Вместе с коллегами он на практике связывает мощь языковых моделей с СУБД, чтобы извлекать из данных реальную пользу, рассказывать, по каким граблям для этого пришлось пройти.
В классическом self-attention каждый токен смотрит на другие токены, чтобы понять, что важно в данный момент.
Внимание распределяется мгновенно:

Именно этот механизм сделал трансформеры тем, чем они стали.
Но вот в чём проблема - внимание не имеет памяти.
Читать полностью »
Мы привыкли использовать ReduceLROnPlateau если val_loss не улучшается N эпох подряд - режем learning_rate. Это работает. Мы ждем, пока обучение врежется в стену, и только потом реагируем.
А что, если мы могли бы увидеть эту стену заранее? Что, если бы мы могли сбросить скорость плавно, еще на подходе к плато, и снова нажать на газ, если впереди откроется новый спуск?
Я хочу поделиться концепцией умного LR шедулера, который управляет скоростью обучения, анализируя не сам loss, а скорость его изменения.
Что с точки зрения CV-инженера, в основном обучающего модели компьютерного зрения, было интересно на конференции Я Железо 2025?
Искусственный интеллект потихоньку делает жизнь проще, но он же становится источником рисков, особенно когда речь идет о нейросетях как о новом подрядчике. Когда компании их интегрируют, не всегда получается досконально продумать то, чем это может быть чревато.
Сегодня я пытаюсь понять реальные риски внедрения нейросетей в рабочие процессы. Надеюсь на твои комментарии, наблюдения и страхи!
В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.
Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:
🌍 более 13 миллионов участников из разных стран;
🏆 сотни активных соревнований ежегодно;
📊 миллионы доступных датасетов и готовых ноутбуков.