- PVSM.RU - https://www.pvsm.ru -

МКС-5000, часть линии
Одна огромная российская производственная компания куёт сталь, которой знаменита наша страна. Эта сталь идёт на строительство судов и на менее романтичные вещи в промышленности вроде труб. У них установлена современная линия МКС-5000, комплекс для производства крупнолистового проката.
Линия управляется вендорской коробкой типа «чёрный ящик», которая знает усреднённые значения параметров для в среднем оптимального получения результата. Но все заготовки разные, и некоторые результаты выходят с линии бракованными. Их пытаются править с помощью мужика с болгаркой или отправляют назад в переплавку в зависимости от типа брака.
Самая больная точка — устройство контролируемого охлаждения (один из 14 этапов линии). Мы пришли туда со своей математикой для двух задач:
Результат — из тех 5% брака мы умеем «спасать» 42% заготовок и знаем про заведомый брак (до окончания обработки на линии) на ещё примерно 35% заготовок. Это 10 миллионов рублей на партию.
Первоначально заготовка (обрезанный сляб) загружается в нагревательную печь, где разогревается до температуры порядка 1300 °C. Греется сляб примерно 6 часов. Затем он очищается от окалины гидравлическим сбивом, проходит через клеть с усилием 12 тысяч тонн и установку предварительной правки. Получается лист. Затем в установке контролируемого охлаждения за счёт сверхточных режимов термомеханической обработки раскат приобретает равномерные свойства и микроструктуру по всей длине и ширине листа. После механической правки и участка замедленного охлаждения листы поступают на инспекцию геометрии и в устройство ультразвукового контроля внутренних дефектов. После чего признанные качественными листы подвергаются окончательной резке и сортировке.

Лист может быть бракован в следующих случаях:
Именно минимизация повреждений из-за действия газов в раскалённой заготовке позволяет больше всего повлиять на снижение брака. Редко когда заготовка приходит сразу бракованной — обычно лист повреждается при охлаждении.
На входе у нас есть набор датчиков, который позволяет всесторонне оценить заготовку. На выходе есть данные контроля качества, которые также дают хорошую картину результата.
Гипотеза в том, что, анализируя первое, второе и режимы работы агрегатов, можно выявить закономерности в том, что именно происходит не так. Напомню, линия уже хороша в состоянии от вендора, но автоматика просто использует некую эвристику «так лучше всем листам» без учёта их индивидуального состояния.
Поскольку интеграция всего этого — процесс длительный, специалисты предприятия сказали следующее: если мы сможем предсказывать брак заранее без ложноположительных срабатываний, то этого будет достаточно для того, чтобы доказать им, что дата-майнинг может быть использован на производстве. Честно говоря, они нам не очень-то доверяли поначалу: это абсолютно нормально, что на тяжёлых производствах металлурги считают тех, кто не видел всего этого вживую несколько лет, немного клоунами.
Результаты первого этапа:
— Модель прогноза аномалий (брака).
— Оценка степени влияния отдельных признаков (параметров) на нарушение температурного режима.
— Оценка степени влияния различных комбинаций признаков на нарушение температурного режима.
— Абсолютную величину влияния изменений каждого единичного признака на температуру (коэффициенты модели линейной регрессии).
Завод предоставил нам огромный массив данных.
Задача попала в нашу команду R&D. Мы вооружились очень быстро, развернули свой движок машинного обучения в своём же облаке (быстрое прототипирование за 2 недели для доказательства коммерческих гипотез — это наш конёк).
Утром мы получили массив, вечером над ним уже работали скрипты, отлаженные в нашей же среде для разработчиков облака.
Для выполнения задачи первого этапа пилота опробованы различные методы машинного обучения для проведения анализа важности признаков. В результате была выбрана модель линейной регрессии, показавшая наилучший предсказательный эффект:
— достоверность классификации (Precision) — 90%;
— точность попаданий (Recall) — 60%.
Выяснилось, что очень многое зависит от того, с какой температурой лист покидает установку контролируемого охлаждения (УКО). Если он чуть более холодный, чем требуется, почти гарантированно будет брак. Выявили ещё ряд параметров, с которыми корреляция была больше 0,7.
Второй вопрос был такой: а почему некоторые листы выходят из УКО чуть более холодными? Изученная выборка состояла из данных первого уровня IBA, данных второго уровня АСУТП, данных логов управляющей модели SMS-Siemag и данных третьего уровня. Потом мы обсудили свои гипотезы с экспертами завода, которые интуитивно знают, где будет брак, а где нет. Их интуитивные эмпирические модели оказались достаточно точными. В итоговой обучающей выборке осталось 197 различных параметров после удаления малозначимых (отсеянных на первом этапе) и редких.
На предыдущем этапе анализа данных большее внимание было уделено моделированию процесса охлаждения и построению регрессионных моделей. На втором этапе задача решалась как классификация (прогноз возникновения брака) по различным сценариям:
— Классы +25°, -25°, +40°, -40° без объединения и удачные охлаждения.
— Классы +25°, -25° и удачные охлаждения.
— Классы +40°, -40° и удачные охлаждения.
Наилучшим методом, опробованным нами для классификации, показал себя метод XGBoost:
— достоверность классификации (Precision) — 98,8%;
— точность попаданий (Recall) — 42,1%.
Эти параметры в дальнейшем могут быть улучшены благодаря обучению модели на новых данных в процессе использования.
Когда по конвейеру едет заготовка, которая в конце окажется браком (50 листов на тысячу), мы детектируем её заранее в 42% случаев (21 лист из тысячи). Ложноположительных срабатываний пока нет.
Практический результат — экономия более 10 миллионов рублей с одной партии металлических листов.
Результат — готовое ядро промышленной системы, способной в случае высокой вероятности брака самостоятельно выставлять нужные параметры охлаждения. Следующая задача — законченное комплексное решение, которое можно будет тиражировать на предприятиях данного типа. То есть интеграция с узлами линии.

Логическая схема целевой комплексной системы предиктивного анализа
Хочется отметить, что мы сознательно проектировали решение таким образом, чтобы сделать его максимально гибким и независимым от информационной инфраструктуры предприятия. Для этого сетевой уровень может быть представлен любой глобальной сетью внешнего оператора связи, а уровень процессинга — облачным сервисом. Хотя весь комплекс можно реализовать на самом предприятии.
Итак, на уровне процессинга в безопасном и отказоустойчивом облаке размещается кластер «озера данных» (Data Lake), куда стекаются все собранные с объекта управления необходимые нам данные. То есть никаких чёрных ящиков с хардкодом — всё можно менять «на лету», в том числе чистить данные.
Итого: 3 недели на доказательство и первые коммерческие результаты.
Такие же проекты мы можем быстро сделать для снижения уровня брака на основе анализа входных параметров изделий для аграрных предприятий, производства автомобилей, производителей двигателей и турбин, самолётостроения, судостроительной сферы, станкостроения. Лучше всего дата-майнинг подходит для оценки обработки деталей, обточки, выплавки, закалки, сборки двигателей, сборки деталей. Везде можно существенно снизить брак, оценивая параметры с помощью датчиков на входе и имея обучающую выборку.
И да, мы можем за пару дней оценить возможный коммерческий эффект (это бесплатно) и собрать ядро по типу, как описано выше (это платно, но довольно быстро и доступно в сравнении с интеграцией). Если интересно получить оценку по вашему производству, пишите на vanraven@gmail.com.
И да, мы как разработчики очень любим такие проекты. Потому что они быстрые, результативные и удивительно хорошие для нашей личной кармы — видно, как математика экономит огромные деньги.
Автор: vanraven
Источник [1]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/ohlazhdenie/284102
Ссылки в тексте:
[1] Источник: https://habr.com/post/415237/?utm_campaign=415237
Нажмите здесь для печати.