Управление данными в проектах внедрения ERP‑систем на основе DAMA‑DMBoK

в 7:30, , рубрики: dama, dama-dmbok, миграция данных, НСИ, основные данные, переменные данные, справочник данных, транзакционные данные, управление данными

Понимание данных прошло эволюционный путь от структуры хранения информации до ключевого элемента в конкурентной борьбе. Сегодняшние информационные технологии, такие как: искусственный интеллект, машинное обучение, предиктивная аналитика, рекомендательные технологии, существуют благодаря большим данным, анализу данных и стремительному развитию вычислительной техники.

Раньше все было иначе. Изначально данные рассматривались как составной, но обязательный элемент компьютерной программы, наряду с командами и алгоритмами. Постепенный функциональный рост софтверных программ от приложения до программного обеспечения, программной системы, информационной системы и корпоративной информационной системы менял взгляд на данные. Уходя от рассмотрения данных только лишь в контексте нормализации данных и СУБД, акцент последовательно перешел к вопросам миграции данных, поддержания их качества и, наконец, бизнес‑процессу управления данными.

Сейчас существует отдельный класс программных систем MDM, ориентированный на управление данными. Ведение основных и переменных данных, НСИ и обработка остатков — все это существенные операции бизнес‑процесса над данными. Не так много литературных источников, содержащих анализ именно бизнес‑процесса работы над данными, исключая детали нормальных форм, SQL‑запросов и прочих технических вопросов. Среди них выделяется свод знаний по управлению данными или DAMA‑DMBoK, рассмотрению которого будет посвящена данная работа.

Цель статьи состоит в обзоре свода знаний DAMA‑DMBoK по управлению данными и его применения в проектах внедрения ERP‑систем. Достижение указанной цели потребует реализации следующих задач:

  • анализ свода знаний DAMA‑DMBoK для управления данными;

  • сопоставление доменов знаний DAMA‑DMBoK и этапов жизненного цикла ERP‑систем;

  • уточнение области применения DAMA‑DMBoK.

Свод знаний DAMA‑DMBoK по управлению данными

Вспомним основные вехи, связанные со сводом знаний DAMA‑DMBoK. В 1980 году была официально зарегистрирована международная добровольная некоммерческая организация DAMA International (Data Management Association), систематизирующая знания и опыт в области управления данными. В 2009 году ею было выпущено первое руководство по своду знаний DAMA‑DMBoK, ставшее основным ресурсом для подготовки специалистов в области данных [1]. Теперь введем ключевые определения, касающиеся данных.

Определение 1Управление данными — разработка, исполнение и контроль выполнения программ, практик и политик предоставления, проверки, защиты и повышения ценности данных и прочих информационных активов на протяжении всего их жизненного цикла.

Определение 2Свод знаний по управлению данными (Data Management Body of Knowledge, DMBoK) — это набор лучших международных практик для управления данными, собираемый ассоциацией DAMA.

Методология DAMA‑DMBoK по управлению данными включает 11-ть областей знаний:

  • руководство данными, где упоминаются стандарты и законы, относящиеся к данным, ведется надзор за данными путем разграничения ролей и полномочий, введения должностных обязанностей и мониторинга аналитической отчетности по ним;

  • моделирование и проектирование данных, здесь строятся и нормализуются структуры данных, отражаются потоки данных, описывается то, как требования пользователей, относящиеся к данным, будут реализовываться;

  • хранение и операции с данными, реализующая поддержку и сопровождение обработки различных видов данных, включая контроль производительности, резервное копирование, репликацию данных и др.;

  • безопасность данных, гарантирующая конфиденциальность и защиту данных от несанкционированного доступа, а также обеспечение коммерческой тайны за счет сбора требований к безопасности и имплементирования решений к ним;

  • интеграция и интероперабельность данных, объединяющая и консолидирующая данные в рамках отдельных хранилищ данных и/или между ними посредствам ETL и ESB‑систем, а также SOA;

  • управление документами и контентом, обеспечивающая работу с неструктурированными данными для соблюдения требований нормативно‑правового регулирования за счет применения ECM, DMS и CMS‑систем;

  • справочные и основные данные, здесь описывается процесс ведения наиболее критичных для предприятия данных, снабжающий актуальной и правдивой информацией все бизнес‑процессы предприятия. Вводятся мастер данные, задающие бизнес‑сущности, и справочные данные, представленные списками перечисленных значений, реализуемые в MDM и RDM‑системах соответственно;

  • ведение хранилищ данных и бизнес‑аналитика, где задается процесс управления данными для поддержки принятия решений, извлечения ценности из данных и формирования отчетности. Определяются DW‑системы, представленные базами данных и механизмами сбора, очистки, преобразования, хранения данных; а также BI‑системы, предназначенные для визуализации данных, построения аналитической отчетности, проведения анализа данных и машинного обучения;

  • метаданные, задающая процесс ведения «данных о данных», включая интеграционные потоки и прочую информацию для их понимания. Выделяют бизнес (преобразования, расчеты и логические формулы), технические (названия таблиц баз данных, ER‑диаграммы, ETL‑операции) и операционные (журналы выполнения пакетной обработки данных, частота/время запуска журналов и др.) метаданные;

  • качество данных, вводящая методические решения для измерения, оценивания и повышения качества данных. Выявляются критически важные объекты данных, анализируются и устраняются проблемы, связанные с ними;

  • архитектура данных, определяющая концептуальное видение по управлению информационными активами организации в соответствии с ее целями, строится корпоративная архитектура данных, а также формулируются стратегические требования к данным и дизайнам решений для достижения выгод компании;

а также такие тематические разделы, как:

  • этика обращения с данными, в котором подчеркивается влияние данных на человеческие жизни, ценность данных и говорится о последствиях злоупотребления данными;

  • большие данные и наука о данных, где для последнего задается ключевой бизнес‑процесс, включающий операции от выбора стратегии больших данных для бизнеса до внедрения модели, дающей полезную информацию;

  • оценка зрелости управления данными согласно модели CMM;

  • организация управления данными и ролевые ожидания, знакомящий с ролями в области данных и распределением их ответственности согласно RACI‑матрицы;

  • организационные изменения и управление данными [1].

Области знаний DAMA‑DMBoK и жизненный цикл ERP‑систем

Области знаний DAMA‑DMBoK могут быть представлены в виде пирамиды Питера Айкена, иллюстрирующей ситуации, в которых оказываются многие организации: от внедрения программных продуктов, оперирующих данными, до использования передовых практик по извлечению и аналитике данных. Таблица ниже демонстрирует логическую последовательность этапов работы над данными. Однако свод знаний DAMA‑DMBoK не предписывает строгую последовательность выполнения инициатив, задающих домены знаний, несмотря на упоминание в нем модели зрелости компаний в части бизнес‑процессов по управлению данными [1].

Табл. 1. Пирамида Питера Айкена

№ фазы

Описание фазы

Область знаний DAMA‑DMBoK

Фаза 1 

Покупка организацией приложения с поддержкой СУБД

Моделирование и проектирование данных; хранение и операции с данными; безопасность данных; интеграция и интероперабельность данных;

Фаза 2

Организация сталкивается с проблемой качества имеющихся данных при применении приложения

Метаданные; качество данных; архитектура данных;

Фаза 3

Осознания необходимости функции руководства данными для достижения стратегических целей компании

Руководство данными; управление документами и контентом; справочные и основные данные; ведение хранилищ данных и бизнес‑аналитика.

Фаза 4

Компания использует преимущества данных и осуществляет аналитическую деятельность

В контексте жизненного цикла ERP‑систем [2], состоящего из пред‑проекта внедрения, проекта имплементации и пост‑проекта, данные рассматриваются через призму двух активностей [3]:

  • миграция основных и переменных данных, подразумевающая перенос исторической информации в целевую систему на момент продуктивного запуска программного решения;

  • управление бизнес‑процессом ведения мастер данных, в частности при обработке контрагентов (поставщики, клиенты и др.) и номенклатурных позиций (материалы, товары, услуги и др.).

Управление данными представляется как регулярный бизнес‑процесс, сравнимый с закупками, продажами и финансами, к которому предъявляются всевозможные требования и которые необходимо реализовать в информационной системе [4]. Сам же процесс обработки требований усложняется наличием потребности в миграции данных. Таким образом, большая часть инициатив из областей знаний DAMA‑DMBoK реализуются в ходе предпроектного обследования и проекта внедрения ERP‑системы (табл. 2)...

Выходные данные и полный текст статьи

Степанов Д.Ю. DAMA‑DMBoK для управления данными в проектах внедрения корпоративных информационных систем // Корпоративные информационные системы. — 2024. — № 4 (28) — c. 26–31. — URL: https://corpinfosys.ru/archive/2024/issue-28/280-2024-28-damadmbok.

DAMA-DMBoK для управления данными в проектах внедрения корпоративных информационных систем

DAMA‑DMBoK для управления данными в проектах внедрения корпоративных информационных систем

Автор: stepanovdandcorpinfosys

Источник


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js